最後にマハジャン氏は、日本の製造業に向けて次のように提言した。
「日本の『モノづくり』は強みだが、それはハードウェア中心の時代であった。これからは自動車業界のSDV(ソフトウェアデファインドビークル)のように、ハードウェアの強みにAIとソフトウェアの力を掛け合わせなければ、グローバルでは勝てない」
これらハードとソフトの融合においては、「フィジカルAI」の重要性を強調する。従来のロボットは、人間によるティーチングやプログラミングに多大な手間がかかり、環境変化への柔軟性が低いという課題があった。これに対し同社は、「ロボット基盤モデル」や「空間World Model技術」によって生成AIを活用してロボットに柔軟な動きをさせることで、製造ラインのコスト削減とフレキシビリティ向上に貢献すると述べた。
富士通は、製造業の変革に不可欠なものとして、次世代CPUやフィジカルAI技術などの開発を続ける方針だ。「日本の製造業が再びグローバルでリーダーシップを取れるよう、当社が支え手になりたい」(マハジャン氏)と決意を語った。
会場では、同日(2025年12月2日)発表された「空間World Model技術」のデモンストレーションを披露した。これは、ロボットが周囲の状況を認識し、数秒先の未来を予測して行動するための技術だ。
現在の自律移動ロボットやフィジカルAIの多くは、工場や倉庫といった「構造化された環境(ルールや動線が規定された空間)」に特化している。そのため、突発的な人の動きや過剰な回避行動が発生し、円滑な協調が困難という課題があった。
富士通が開発した空間World Model技術では、環境内の固定カメラと、移動するロボットに搭載されたカメラが空間把握を行い、3Dシーングラフの時系列データを解析することで、対象空間における未来の状態を予測する。
デモンストレーションでは、立ち入り禁止区域を含むエリアを、四足歩行ロボットがパトロールをしているという状態で実演した。人間がバッグを持ちながら立ち入り禁止区域に近付こうとすると、ロボットと空間内のアラートが反応した。従来のセンサー検知では、人がエリアに入ってからアラートが鳴る事後対応型が一般的だが、同技術では入る前に行動を予測している。
これを可能にするのが、富士通が培ってきた「ビジョンAI技術」である。従来のマルチカメラ統合手法では、視点間のひずみや照明条件の差異、通信帯域の制約が課題であった。同技術では、人やロボットなど特定のオブジェクトの情報を、固定カメラ(俯瞰(ふかん)視点)とロボットカメラ(移動視点)の2つで捉えることで見え方の差異を吸収。これらを統合処理することで、複雑に変化する空間をリアルタイムに生成している。なお、カメラは一般的なWebカメラを使用している。
また、単なる軌道予測ではなく、人対人や人対ロボットなど各相互作用を学習した学習モデルを活用することで、時系列データから「被写体が次にどのような行動をとるか」という意図を推定することを可能にした。実証実験では、従来比3倍の精度で行動意図を推定できることが確認された。
同技術は実装に向けた研究開発段階にある。今後は、工場内や商業施設など環境変化が激しい場所へのロボット展開に活用したい考えだ。将来的には複数の異種ロボットが混在する環境において、衝突回避だけでなく、タスク効率を最大化する動的な経路計画/協調動作プランの生成への実現を目指す。
フィジカルAI実現へ、NVIDIAと富士通がチップからサービスまでAIインフラで協業
生成AIを軽量化する再構成技術を開発、1ビット量子化でメモリ消費量を94%削減
富士通が語るAIエージェント戦略、“足の小指を打たない”データ活用の在り方とは
長い通路を抜けると、そこはFCNTの地下実験室だった
産総研の最新スパコン「ABCI 3.0」が生成AIの研究開発と社会実装を加速するCopyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク
よく読まれている編集記者コラム