CPUだけでリアルタイム群集計測を実現、東芝が従来比4倍性能の深層学習技術人工知能ニュース

東芝は2020年6月12日、CPU上でカメラ映像を解析して人数や密集度合いを計測できる、新しい手法のディープラーニング技術の開発を発表した。GPUと比較すると非力なプロセッサであるCPUなどのデバイス上で、高速かつ高精度にリアルタイムで映像解析を行える。

» 2020年06月12日 08時00分 公開
[池谷翼MONOist]

 東芝は2020年6月12日、CPU上でカメラ映像をリアルタイムに解析して人数や密集度合いを計測できる、新しい手法のディープラーニング(深層学習)技術を開発したと発表した。一般的に、カメラ映像をディープラーニングでリアルタイムに解析する場合にはCPU以外にGPUなどのデバイスが必要になるが、新技術はCPUだけでもリアルタイム解析を可能にする。

 群集の混雑度合いを推定する群集計測AI(人工知能)は、以前から駅や空港、商業施設などで設備の安全管理対策に有効だとして注目されてきた。最近では新型コロナウイルス感染症(COVID-19)の感染拡大防止の観点から、施設内での密集状態を回避する目的でもニーズが高まっている。

カメラ映像から人の密集度や人数を計測する[クリックして拡大]出典:東芝 カメラ映像から人の密集度や人数を計測する[クリックして拡大]出典:東芝

 群集計測AIはディープラーニングを活用することで、高密度に密集している人の数を高精度かつリアルタイムに計測できる。しかし、CPUはディープラーニングに求められる大規模な並列演算処理が得意ではないため、リアルタイムに計測結果を得るにはGPUなどの専用デバイスが必要となる。GPUは高価でコスト負担が大きいため、群集計測AIの普及を妨げる障壁の1つとなっていた。

群集計測AIのニーズは高い[クリックして拡大]出典:東芝 群集計測AIのニーズは高い[クリックして拡大]出典:東芝

 これに対して新開発の手法では、GPUではなく一般的なPCに搭載されているCPU上でもディープラーニングを用いた映像解析を高速で実行可能だ。既存のCPUを用いるディープラーニング技術と比較すると、映像解析の処理能力は約4倍に向上し、1秒間に3台程度のカメラ映像をリアルタイムに解析できる。またCPUはメンテナンス性や長期間の調達可能性といった面でもGPUより優れており、保守管理の観点からも評価できるという。

 なお新技術はCPUと同等程度かそれ以上の処理能力を有するものであれば、どのようなプロセッサにも実装可能だ。GPUやFPGAの他、AIアクセラレータなどでも動作する。エッジデバイスは一般的に処理能力の高いプロセッサを搭載しにくいとされているが、新技術で処理性能を補うことで高性能なエッジAIカメラとして活用することも可能になる。

 また新技術は高い計測精度を実現している点も特徴だ。東芝 研究開発センターの山地雄土氏によると「群集計測AIは一般的に、映像内に映る人物の頭部を手掛かりにして密集度合いや人数を計測する。しかし、既存のディープラーニング技術では、映像奥と手前で人物のサイズが異なる場合に、人数を正確に計測できないという課題があった。新技術ではディープラーニングのネットワーク構造を工夫することで、映像内のサイズにかかわらず正確に解析できるようにした」と語る。実際に公開データセットを用いた性能評価実験では、既存の手法に比べて画像1枚当たりの推定人数の誤差が改善されていることを確認したという。

独自のネットワーク構造を開発して高精度を実現した[クリックして拡大]出典:東芝 独自のネットワーク構造を開発して高精度を実現した[クリックして拡大]出典:東芝

 今後の新技術開発の展望として山地氏は「新技術は人物だけでなく、密集度の高い自動車や商品、箱などの台数や個数を計測することも可能だ。交通渋滞の検知や商品在庫の解析などの用途での開発も進めていきたい」と語った。

Copyright © ITmedia, Inc. All Rights Reserved.