2次元画像から建物や人を動的かつ高精度に3次元化する技術を開発人工知能ニュース

富士通は、カーネギーメロン大学との共同研究で、1台の単眼カメラから得られる2次元画像を3次元化する技術を開発した。建物で隠れた部分などを推定して、監視カメラでは捉えられない事故の原因などを可視化できる。

» 2024年03月21日 14時00分 公開
[MONOist]

 富士通は2024年3月7日、カーネギーメロン大学との共同研究で、1台の単眼カメラから得られる2次元画像を高精度に3次元化する技術を開発したと発表した。交差点など人や車が密集する場面の画像を利用し、監視カメラで捉えられない交通事故の原因などを可視化できる。

 同技術は、2つのコア技術で構成されている。1つ目は「3次元形状推定技術」で、さまざまな角度から撮影した市街の画像を深層学習でモデルに学習させ、単眼カメラの1枚の画像から建物や人の3次元形状を推定する。事前の学習によっては、画像では隠れている建物の裏側なども推定可能だ。

 2つ目の「3次元プロジェクション技術」は、モデルの推定結果を基に3次元化したデジタルツイン上で、人や物体を高精度に配置可能にするものだ。現実世界により近い形で人や車の動きを復元し、障害物が物体の一部を隠している場合も正確に位置を推定できる。

キャプション 開発技術の取り組み概要[クリックで拡大] 出所:富士通

 両者は、同年2月22日に同技術の実証実験を開始した。まず、単眼カメラでカーネギーメロン大学周辺の交差点を撮影し、画像データに映る物体をソーシャルデジタルツイン上で再現する。そこから人の流れや交通状況を分析して、建物や人混みで発生する死角など事故につながる可能性を発見し、事故防止策の立案に活用するなど、開発技術の有効性を検証する。

⇒その他の「人工知能ニュース」の記事はこちら

Copyright © ITmedia, Inc. All Rights Reserved.