可視光カメラ画像の荷物形状を“点”から推定するAI、世界最高精度を達成：人工知能ニュース

東芝は、一般的な可視光カメラで撮影した画像から、不規則に積み重なった物体の個々の領域を高精度に推定するAI技術を開発したと発表した。公開されているピッキングロボット向けデータセットを用いた実証実験では、物体領域の推定における計測誤差で、既存のAI技術と3Dセンサーの組み合わせを上回る「世界トップの性能」（同社）を達成した。

[朴尚洙，MONOist] PC用表示関連情報

LINE

Hatena

　東芝は2020年11月30日、一般的な可視光カメラで撮影した画像から、不規則に積み重なった物体の個々の領域を高精度に推定するAI（人工知能）技術を開発したと発表した。公開されているピッキングロボット向けデータセットを用いた実証実験では、物体領域の推定における計測誤差で、既存のAI技術と3Dセンサーの組み合わせを上回る「世界トップの性能」（同社）を達成したという。2021年度には、このAI技術を組み込んだ物流倉庫など向けの荷降ろしロボットを市場投入する計画である。

東芝が開発した物体認識AI技術の概要（クリックで拡大）出典：東芝

東芝が開発した「点候補ベース物体領域抽出技術」のデモの様子。ほぼリアルタイムに荷物の形状を認識できていることが分かる（クリックで再生）出典：東芝

　物流倉庫の荷降ろしやピッキングに用いられているロボットは、ロボットの先端部などに装着した3Dセンサーなどを用いて積み重なった荷物を上からセンシングして個々の荷物の形を認識し、「把持計画」を作成してから目的の荷物を把持するという動作を行っている。今回開発したAI技術は、3Dセンサーではなく一般的な可視光カメラの画像データからでも把持計画に必要な荷物の形状認識を正確に行えることが特徴になる。

荷降ろしやピッキングを行うロボットにおける把持計画のイメージ（クリックで拡大）出典：東芝

　高さに関するデータも得られる3Dセンサーを用いる場合、高い荷物の形状認識精度が得られるものの、周辺環境と合わせ込むための調整や、組み上げたシステムを使って現地でAIの学習を行う必要があるなど導入のためのハードルが高い。一方、開発したAI技術は、調整が極めて少なくて済む可視光カメラを用いながら、3Dセンサーを用いる場合と同等以上の荷物の形状認識精度を実現しており、AIの学習を事前に行うなどして即時導入を可能にするとともに現地調整を短縮することによる導入コストの削減も実現できるとしている。

長方形に切り出してからではなく、点から物体の領域を推定する

　画像データから個々の物体領域を推定するAI技術としては、画素単位で画像内の個々の物体の種類と領域を推定する「インスタントセグメンテーション」が知られている。インスタントセグメンテーションの中で最も広く用いられている「Mask R-CNN」は、入力画像内の物体がある候補位置を長方形で切り出してから、その長方形内に含まれる物体の領域を推定する方式だが、物流倉庫の荷物のように物体が重なって映っている場合には正しく物体の領域を推定できないという課題があった。「特に、荷降ろしやピッキングに用いるロボットのように上方から撮影する画像で生じやすい」（東芝研究開発センター上席研究員の野田玲子氏）という

インスタントセグメンテーション（左）とMask R-CNN（右）の概要（クリックで拡大）出典：東芝

Mask R-CNNでは物体が重なって映っている場合に正しい推定が難しい（クリックで拡大）出典：東芝

　東芝が今回開発したAI技術は、Mask R-CNNのように物体がある候補位置を長方形で切り出すのではなく、何らかの物体があると思われる画素の中から最も確からしい候補点を推定し、その候補点を含む物体の領域を推定するという手法を採用した。このため名称も「点候補ベース物体領域抽出技術」となっている。「物体内の候補点を起点として、その点が属する物体領域を推定するので、重なっている物体でもそれぞれの領域を正しく推定できる」（野田氏）。

点候補ベース物体領域抽出技術（左）は、物体同士の重なりに強い（右）（クリックで拡大）出典：東芝

　実際に、ピッキングロボット向けデータセットである「WISDOM dataset」を用いた推定精度について、Mask R-CNNや、3Dセンサーの震度画像を用いてMask R-CNNを行う「SD Mask R-CNN」と比較すると、点候補ベース物体領域抽出技術はSD Mask R-CNNを上回る結果が得られた。また、同AI技術に基づくアルゴリズムはCPUで動作可能であり「荷降ろしして次に現れる荷物形状もほぼ即時に認識できるなど、リアルタイム性も高い」（野田氏）としている。ただし、ロボットが吸着ハンドなどを使って荷物を把持する際には、距離センサーなどを使ってロボットハンドから荷物までの位置を計測する必要がある。

「WISDOM dataset」を用いた推定精度の比較（クリックで拡大）出典：東芝

　今後は、2021年度に市場投入予定の物流倉庫向け荷降ろしロボットの他にも、工場でのマーシャリングや箱詰め、小売店舗における無人レジや棚卸しなどへの適用も想定している。なお、点候補ベース物体領域抽出技術については2020年11月30日～12月4日までオンラインで開催されるコンピュータビジョンの国際会議「ACCV 2020」で発表される予定だ。

　物流現場における自動化が進む中、倉庫内の荷物の搬送のみならず、荷降ろしやピッキングなどの作業もロボットによる自動化が進められている。こうした物流ロボットの国内市場は、2030年度に2020年度比で約8倍の1500億円規模まで拡大すると予測されている。また、新型コロナウイルス感染症の感染拡大により、非接触や倉庫内でのソーシャルディスタンス確保のニーズも高まっており、物流ロボットの導入がさらに加速する流れにある。

⇒その他の「人工知能ニュース」の記事はこちら

可視光カメラ画像の荷物形状を“点”から推定するAI、世界最高精度を達成：人工知能ニュース

長方形に切り出してからではなく、点から物体の領域を推定する

関連記事

関連リンク