検索
連載

産総研のフィジカルAIプロジェクトに迫る 10万年ギャップを超えろ!組み込みイベントレポート(2/5 ページ)

産業技術総合研究所(産総研)が「フィジカル領域の生成AI基盤モデルに関する研究開発」プロジェクトについて解説するウェビナーを開催。同プロジェクトを構成する6つのグループから最新の研究成果が報告された。

Share
Tweet
LINE
Hatena

ケン・ゴールドバーグ氏の論文「10万年データギャップ問題」とは

 課題となっているのが、パフォーマンスの向上と関わるデータの不足だ。基盤モデルの本質は、データの質と量であり、より広い分野に応用するためにはまだまだアクションデータが不足している。オープンデータも不足している。一方で、新しい基盤モデルが次々に発表されており、研究者によるキャッチアップも難しい。開発者がそれらの基盤モデルを試すための環境が整っておらずハードルは高い。

 データ不足問題については、カリフォルニア大学バークレー校 教授のケン・ゴールドバーグ(Ken Goldberg)氏が2025年8月に、「10万年データギャップ問題」という論文を「Science Robotics」に投稿している。同論文は、言語/画像データに比べて、ロボットの実世界データは約10万年分不足しており、このデータギャップが汎用ロボット開発を阻んでいると指摘している。

ケン・ゴールドバーグ氏が指摘する「10万年データギャップ問題」
ケン・ゴールドバーグ氏が指摘する「10万年データギャップ問題」[クリックで拡大] 出所:産総研

 この課題を解決すべく、さまざまな形でデータ収集が進められている。実世界での人間による操作の模倣、シミュレーションによる合成データ、そして最近ではWeb上の動画を使う方法が注目されている。ただし、それぞれまだ課題がある。

ロボットデータの収集方法。実機操作データかシミュレーション
ロボットデータの収集方法。実機操作データかシミュレーション[クリックで拡大] 出所:産総研

 産総研でもさまざまな研究を進めているが、今回は実データの模倣に関する研究成果が発表された。双腕遠隔操作システムのALOHA(A Low-cost Open-source Hardware System for Bimanual Teleoperation)を使った日常/産業タスクの模倣学習データを、2023年から収集しており、約1万時間の双腕ロボットのデータが「AIST-Bimanual Manipulation」として2025年9月に無償公開されている。このようなデータセットを活用することで、さまざまなタスクに波及できる「ロボット基盤モデル」を構築するための初期投資を抑えることが可能になる。

産総研でのデータ収集
産総研でのデータ収集[クリックで拡大] 出所:産総研

 また、基盤モデルを試せるソフトウェアフレームワーク「RoboManipBaselines」もGitHubで公開している。同フレームワークは、さまざまなロボット、環境、モデルなどへ拡張が可能な設計となっている。

ソフトウェアフレームワーク「RoboManipBaselines」
ソフトウェアフレームワーク「RoboManipBaselines」[クリックで拡大] 出所:産総研

 堂前氏は、「ロボットの社会実装に向けたギャップを埋めるために、開発環境の構築やデータ収集コストを下げて開発を進められる環境を整えたというのが現在の成果だ」と語る。産総研では、共同研究やコンサルティング契約も進めており、モデル構築の原理原則を理解する学術研究と、その基礎を知った上で基盤モデルを応用するための技術、そして社会普及への活動を一貫して実施しているという。

基盤モデルの研究/応用を進めるためのフレームワーク
基盤モデルの研究/応用を進めるためのフレームワーク[クリックで拡大] 出所:産総研

 産総研が開発しているロボット基盤モデル自体については、まだ公開できる段階にないが、AIロボット協会(AIRoA)が実施するコンペティションに産総研チームが参加している。成果報告会では、同チームがコンペティションのステージ1を通過してステージ2に進んだことが紹介された。2026年度には、これらの研究成果の一部を順次発信していきたいとしている。

 AIロボット協会(AIRoA)のコンペに産総研もコミットしていると紹介された。現在、6チームによるステージ1コンペを勝ち抜いてステージ2に進出しており、2026年度にはモデルの中身などを公開していきたいとしている。

 最後に堂前氏は「10万年ギャップは本当に超えられるのか」と再度問いかけた。最近、模倣学習のデータセット作りは簡便化が進んでいる。ウェアラブルデバイスを手先に着けたり、「iPhone」を身体に着けたりするだけでデータ収集し、そのデータを元に座標変換を行ってロボットを動かすといったものだ。これらの技術によって、データ収集のスケールアウトが可能になりつつある。

模倣学習のデータセット作りは簡素化が進む
模倣学習のデータセット作りは簡素化が進む[クリックで拡大] 出所:産総研

 地球の人口は現在82億人とされている。そのうちインターネット人口が60億人とすると、もしウェアラブルデバイスを全員が着けてデータ収集すれば、1人当たり8.76分だけで10万年ギャップに相当するデータが収集できる計算になる。人口約1億2000万人の日本だけで同じ計算をしても1人当たり約8.27時間、つまり1日でデータを収集できてしまう。堂前氏は「これはもちろん、かなり雑駁な数字ではあるものの、10万年ギャップはそれほど大きな壁ではなく、今後もこのような前提で議論を進めていくべきではないか」と締め括った。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る