ロボット制御AIのオフライン強化学習で東芝が世界初と世界最高精度を達成人工知能ニュース(2/2 ページ)

» 2024年05月10日 07時00分 公開
[朴尚洙MONOist]
前のページへ 1|2       

ロボットアームの操作範囲を2段階に分けて制御し学習する

 新技術を開発する上で重要な要素となったのが、ロボットアームの操作範囲を2段階に分けて制御し学習することだ。1段目の制御では撮影した画像からロボットアームの移動先を決定し、2段目の制御では移動先周辺のみを切り取った画像から移動先を補正する。

オフラインデータによる2段階制御学習手法 オフラインデータによる2段階制御学習手法[クリックで拡大] 出所:東芝

 従来のオフライン学習で行っていたのは1段目の制御だけだった。新技術で導入した2段目の制御の学習は、注目領域のみを含む画像が入力され、画像の回転/切り取り/合成などによってデータを増やすデータの水増しができ、効率的に学習可能な移動先の補正のみを学習対象としている。これらのことにより、少量のデータでも高い精度のロボット制御が可能なAIのオフライン学習が可能になった。

2段目の補正学習により少量データでも高精度の制御を学習できる 2段目の補正学習により少量データでも高精度の制御を学習できる[クリックで拡大] 出所:東芝

 新技術を用いてロボット操作100回分の画像データで学習したロボット制御AIについて、公開ベンチマーク環境であるRLBenchによるシミュレーション評価を行った。その結果、ピッキングや物を置くなどの8種類の作業をそれぞれ500回行った際の平均成功率は、従来のオフライン強化学習の36%から倍増となる72%に向上した。

 作業ごとの成功率では、鍋のふたを持ち上げる「TakeLidOffSaucepan」が79%から99%、傘立てから傘を取り出す「TakeUmbrellaOutOfUmbrellaStand」が40%から90%など、90%を超える事例も出た。成功率が最も低かった、ブロックをつかんで持ち上げる「PickAndLift」でも、4%から47%と大幅な改善を確認している。

8種類の作業ごとの成功率 8種類の作業ごとの成功率[クリックで拡大] 出所:東芝

 なお、今回の新技術の開発は、理化学研究所 革新知能統合研究センター長 兼 東京大学 大学院新領域創成科学研究科教授の杉山将氏との共創の成果によるものだ。また、新技術の詳細は、ロボティクス分野の国際学会である「ICRA(IEEE International Conference on Robotics and Automation) 2024」(2024年5月13〜17日、パシフィコ横浜)で、同年5月14日に発表される予定だ。

⇒その他の「人工知能ニュース」の記事はこちら

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.