可視光カメラ画像の荷物形状を“点”から推定するAI、世界最高精度を達成:人工知能ニュース
東芝は、一般的な可視光カメラで撮影した画像から、不規則に積み重なった物体の個々の領域を高精度に推定するAI技術を開発したと発表した。公開されているピッキングロボット向けデータセットを用いた実証実験では、物体領域の推定における計測誤差で、既存のAI技術と3Dセンサーの組み合わせを上回る「世界トップの性能」(同社)を達成した。
東芝は2020年11月30日、一般的な可視光カメラで撮影した画像から、不規則に積み重なった物体の個々の領域を高精度に推定するAI(人工知能)技術を開発したと発表した。公開されているピッキングロボット向けデータセットを用いた実証実験では、物体領域の推定における計測誤差で、既存のAI技術と3Dセンサーの組み合わせを上回る「世界トップの性能」(同社)を達成したという。2021年度には、このAI技術を組み込んだ物流倉庫など向けの荷降ろしロボットを市場投入する計画である。
物流倉庫の荷降ろしやピッキングに用いられているロボットは、ロボットの先端部などに装着した3Dセンサーなどを用いて積み重なった荷物を上からセンシングして個々の荷物の形を認識し、「把持計画」を作成してから目的の荷物を把持するという動作を行っている。今回開発したAI技術は、3Dセンサーではなく一般的な可視光カメラの画像データからでも把持計画に必要な荷物の形状認識を正確に行えることが特徴になる。
高さに関するデータも得られる3Dセンサーを用いる場合、高い荷物の形状認識精度が得られるものの、周辺環境と合わせ込むための調整や、組み上げたシステムを使って現地でAIの学習を行う必要があるなど導入のためのハードルが高い。一方、開発したAI技術は、調整が極めて少なくて済む可視光カメラを用いながら、3Dセンサーを用いる場合と同等以上の荷物の形状認識精度を実現しており、AIの学習を事前に行うなどして即時導入を可能にするとともに現地調整を短縮することによる導入コストの削減も実現できるとしている。
長方形に切り出してからではなく、点から物体の領域を推定する
画像データから個々の物体領域を推定するAI技術としては、画素単位で画像内の個々の物体の種類と領域を推定する「インスタントセグメンテーション」が知られている。インスタントセグメンテーションの中で最も広く用いられている「Mask R-CNN」は、入力画像内の物体がある候補位置を長方形で切り出してから、その長方形内に含まれる物体の領域を推定する方式だが、物流倉庫の荷物のように物体が重なって映っている場合には正しく物体の領域を推定できないという課題があった。「特に、荷降ろしやピッキングに用いるロボットのように上方から撮影する画像で生じやすい」(東芝 研究開発センター 上席研究員の野田玲子氏)という
東芝が今回開発したAI技術は、Mask R-CNNのように物体がある候補位置を長方形で切り出すのではなく、何らかの物体があると思われる画素の中から最も確からしい候補点を推定し、その候補点を含む物体の領域を推定するという手法を採用した。このため名称も「点候補ベース物体領域抽出技術」となっている。「物体内の候補点を起点として、その点が属する物体領域を推定するので、重なっている物体でもそれぞれの領域を正しく推定できる」(野田氏)。
実際に、ピッキングロボット向けデータセットである「WISDOM dataset」を用いた推定精度について、Mask R-CNNや、3Dセンサーの震度画像を用いてMask R-CNNを行う「SD Mask R-CNN」と比較すると、点候補ベース物体領域抽出技術はSD Mask R-CNNを上回る結果が得られた。また、同AI技術に基づくアルゴリズムはCPUで動作可能であり「荷降ろしして次に現れる荷物形状もほぼ即時に認識できるなど、リアルタイム性も高い」(野田氏)としている。ただし、ロボットが吸着ハンドなどを使って荷物を把持する際には、距離センサーなどを使ってロボットハンドから荷物までの位置を計測する必要がある。
今後は、2021年度に市場投入予定の物流倉庫向け荷降ろしロボットの他にも、工場でのマーシャリングや箱詰め、小売店舗における無人レジや棚卸しなどへの適用も想定している。なお、点候補ベース物体領域抽出技術については2020年11月30日〜12月4日までオンラインで開催されるコンピュータビジョンの国際会議「ACCV 2020」で発表される予定だ。
物流現場における自動化が進む中、倉庫内の荷物の搬送のみならず、荷降ろしやピッキングなどの作業もロボットによる自動化が進められている。こうした物流ロボットの国内市場は、2030年度に2020年度比で約8倍の1500億円規模まで拡大すると予測されている。また、新型コロナウイルス感染症の感染拡大により、非接触や倉庫内でのソーシャルディスタンス確保のニーズも高まっており、物流ロボットの導入がさらに加速する流れにある。
関連記事
- AIと機械学習とディープラーニングは何が違うのか
技術開発の進展により加速度的に進化しているAI(人工知能)。このAIという言葉とともに語られているのが、機械学習やディープラーニングだ。AIと機械学習、そしてディープラーニングの違いとは何なのか。 - 機械学習はどうやって使うのか――意外と地道な積み重ね
前編では、AI(人工知能)と機械学習、ディープラーニングといった用語の説明から、AIを実現する技術の1つである機械学習が製造業を中心とした産業界にも徐々に使われ始めている話をした。後編では、機械学習を使ったデータ分析と予測モデル作成について説明する。 - CPSテクノロジー企業を目指す東芝、ソフトウェアはどのように開発しているのか
東芝が、同社の事業戦略の中核を成すCPSを支えるソフトウェア生産技術について「説明。アジャイルプロセスなどを活用することで、IoT関連のサービスであれば約2週間のスパンでリリースできる体制を構築できているという。基幹系システムなどのソフトウェア開発で重要な役割を占める要件定義プロセスにAIを適用するための取り組みも進めている。 - 顔と氏名を瞬時にひも付け特定/追跡、TDSLの顔認識AI搭載ソリューション
東芝デジタルソリューションズは2020年11月24日、同社が独自開発した顔認識AIエンジンを搭載して、映像内の人物特定を行うソリューション「カオメタ」の説明会を開催した。独自の顔認識AIエンジンと氏名と顔をひも付けたデータベースを連携させることで、映像内の人物を特定し、追跡し続けることが可能だ。 - CPUだけでリアルタイム群集計測を実現、東芝が従来比4倍性能の深層学習技術
東芝は2020年6月12日、CPU上でカメラ映像を解析して人数や密集度合いを計測できる、新しい手法のディープラーニング技術の開発を発表した。GPUと比較すると非力なプロセッサであるCPUなどのデバイス上で、高速かつ高精度にリアルタイムで映像解析を行える。 - 東芝から世界最高精度の自動運転AI技術が2つ、推定誤差を従来比4割削減
東芝は、自動車やドローンなどの安全性向上や自動走行・自律飛行に用いる2つのAI(人工知能)技術で世界最高精度を達成したと発表した。1つは、カメラと慣性センサーの組み合わせだけで自車両の動きを高精度に推定する「自車両の動き推定AI」で、もう1つはさまざまな交通シーンで周辺車両の将来の動きを予測する「他車両の動き予測AI」。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.