子供や高齢者の行動を静かに見守る自動販売機や電柱。住む人の様子を常に、そっとうかがう窓や家電。犯罪や事故が起こる前に、予兆を察知して人間に知らせてくれるビルやオフィス、店舗、駅――。各種のセンサー、画像解析、ロボット、人工知能(AI)などの技術の発達に伴い、人々を見守る仕組みが広がっている。将来的には、いつも社会全体が人々を見守っている、そんな環境が訪れるはずだ。


「10分後、●●の交差点付近のコンビニエンスストアで立てこもり事件が起こります」
「いま店内の通路●●を歩いている人物は、このあと●●を万引きします」
「今日はできるだけ早く帰宅するようにしてください。夕方になると奥様の体調が悪くなります」

こんな警告を受けたら、どう思うだろうか。しかも、それがたいてい、その通りになるとしたら…。まるで、社会全体を高度な人工知能(AI)が管理しているSF映画のように思うかもしれないが、全くの絵空事でもない。IoT(Internet of Things)、センサー、ビッグデータなどの技術の進歩により、そんな社会は徐々に現実に近づいている。

身の回りの危険や問題を事前に察知

私たちの生活には、様々な危険が潜んでいる。いつ、どんな場所で犯罪や災害に巻き込まれるかわからないし、最近はテロの脅威も膨らんでいる。そんな中で、日本では2020年の東京オリンピック開催を控え、より安全安心な街づくりが求められている。

こうしたテロ対策、防犯、防災用としては、まず監視カメラが頭に浮かぶだろう。実際、既に監視カメラは様々な場所に設置されている。ただ、単に監視カメラで様子を撮影し、映像を記録しておくだけでは、犯罪や事故そのものは防げない。人が絶え間なく監視するのにも限界がある。そこで注目されているのが、監視カメラからの画像をリアルタイムに解析する仕組み。犯罪に関わりそうな人物を自動的に見つけ出すシステムである。

一例が、ロシア政府の研究機関を母体とするELSYSが開発した画像解析システム「DEFENDER-X」である。監視カメラなどで撮影した人物の精神状態を可視化し、不審者を自動で検知する。特殊なハードウエアを必要とせず、汎用の監視カメラとパソコンで解析を行う。通常、デジタルで撮影される動画は毎秒30枚程度の画像で構成されているが、画像1枚ごとに、対象者の顔の皮膚や眼球、口元、まぶたなどがどれだけ動いたのかを検出し、それらに基づいて得られる50の指標で数値化する。10万人以上の実験で得たベンチマークデータをベースに、攻撃性やストレスのほか、 神経質、抑圧、自制心、活力、カリスマ性、安定性、疑心、緊張などの10項目で精神状態を判断する(図1)。例えば入場ゲートを通過する際や、警備員などの前で異常な緊張感を持っている人物がいたら、不審者としてマークする。

[画像のクリックで拡大表示]
(図1) DEFENDER-Xによる精神状態の可視化(ELSYS JAPANのホームページより引用)

既にこのシステムには、2014年のソチ五輪での利用実績がある。大会期間中、1日平均で約1200人がDEFENDER-Xが設置されたゲートを通過し、そのうちの5~15人/日を不審者として検知した。該当者を事情聴取した結果、9割が薬物や酒など禁止物の持ち込みやチケットを持たず不正入場を試みる客だったという。

一方で、監視カメラ自体の機能も進化している。パナソニックがシンガポール国立大学と共同で開発した顔認証技術がその一つだ。従来、顔認証技術は、斜め方向からの認証、照明の明暗が強い場所での認証、サングラスやマスクなど一部顔が隠れている場合の認証など、苦手とするシーンがあった。これに対してパナソニックらは、ディープラーニングを利用することで、前述のようなシーンでの認証精度を大幅に改善した(図2)。

(図2)パナソニックが共同開発した顔認証技術で認識可能な画像(パナソニックのプレスリリースより抜粋)

似た取り組みでは、GPUを提供する米NVIDIAも、ビデオ分析プラットフォーム「Metropolis」を開発した。治安維持や交通管理など都市機能を見守る複数の監視カメラの画像を、ディープラーニングによってリアルタイムに分析する。既に50社以上のパートナー企業が、Metropolisによるアプリケーションの提供を開始している。

こうした仕組みが浸透していけば、街の動きをデータとしてとらえ、管理できるようになる。いわば“街のデジタルツイン”だ。そう捉えると、冒頭に挙げた例のようなシーンが現実味を帯びてくる。

映像+αで見守りが高度化

人間が犯罪や事故などの危険を察知する際、判断材料は、カメラのように表面的に目に見える情報だけではない。ほかのデータや分析を組み合わせることで、見守りの仕組みはさらに高度化していく。

例えば、映像そのものではなく、人やモノの動きのパターンに着目する。歩き方で個人を特定する歩容認証のようなものだ。ほかにも、不審な物音、ガス漏れなどの異臭はもちろん、熱、わずかな振動など、視覚以外から入ってくる情報によって異常に気づくケースも多い。こうしたことから、見守りの仕組みも、視覚、聴覚、嗅覚、触覚など、様々な情報を集約して、総合的に判断するようになっていく。

それを実践しようとしているものの一例が、アースアイズが開発した見守りロボット「アースアイズ」である。映像に、人の動き、音、においといった情報を合わせて収集・分析する仕組みを備える(写真1)。

(写真1)アースアイズの自動監視ロボット