新技術を開発する上で重要な要素となったのが、ロボットアームの操作範囲を2段階に分けて制御し学習することだ。1段目の制御では撮影した画像からロボットアームの移動先を決定し、2段目の制御では移動先周辺のみを切り取った画像から移動先を補正する。
従来のオフライン学習で行っていたのは1段目の制御だけだった。新技術で導入した2段目の制御の学習は、注目領域のみを含む画像が入力され、画像の回転/切り取り/合成などによってデータを増やすデータの水増しができ、効率的に学習可能な移動先の補正のみを学習対象としている。これらのことにより、少量のデータでも高い精度のロボット制御が可能なAIのオフライン学習が可能になった。
新技術を用いてロボット操作100回分の画像データで学習したロボット制御AIについて、公開ベンチマーク環境であるRLBenchによるシミュレーション評価を行った。その結果、ピッキングや物を置くなどの8種類の作業をそれぞれ500回行った際の平均成功率は、従来のオフライン強化学習の36%から倍増となる72%に向上した。
作業ごとの成功率では、鍋のふたを持ち上げる「TakeLidOffSaucepan」が79%から99%、傘立てから傘を取り出す「TakeUmbrellaOutOfUmbrellaStand」が40%から90%など、90%を超える事例も出た。成功率が最も低かった、ブロックをつかんで持ち上げる「PickAndLift」でも、4%から47%と大幅な改善を確認している。
なお、今回の新技術の開発は、理化学研究所 革新知能統合研究センター長 兼 東京大学 大学院新領域創成科学研究科教授の杉山将氏との共創の成果によるものだ。また、新技術の詳細は、ロボティクス分野の国際学会である「ICRA(IEEE International Conference on Robotics and Automation) 2024」(2024年5月13〜17日、パシフィコ横浜)で、同年5月14日に発表される予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.