現在のVLAについて、リアルワールド日本代表取締役のイ・フン氏は「時間的な動きを理解する『Motion Awareness』、どの製品が箱の中に入っていたのかなど過去のコンテキストを理解する『Long-term Memory』、USBソケットにプラグを正しく入れるといった接触を伴うタスクを理解する『Physical Sensing』が足りていない」と語る。

VLAの課題について［クリックして拡大］出所：リアルワールド

　これを踏まえてリアルワールドは独自のVLM（視覚言語モデル）と、同社のコアアーキテクチャ「マルチストリーム・アクション・トランスフォーマー（Multi-Stream Action Transformer、MSAT）」で差別化を図っている。

　従来のVLAモデルは視覚／言語／行動／触覚／メモリといった異なる信号を単一ストリームで処理していた。これに対しMSATは、各モダリティに独立したストリームを設け、モダリティ間のジョイントアテンションによって統合する構造を採用している。

　さらに、力や触覚といった視覚では捉えられない物理信号や長期記憶についても、専用モジュール（Physics Module、Memory Module）で処理することで、単一モデルが「見て（see）／感じて（feel）／記憶し（remember）／適応する（adapt）」一連のプロセスを実現している。

RLDX-1の強み［クリックして拡大］出所：リアルワールド

　リアルワールドは、SKテレコム、LG電子、CJ大韓通運、ロッテ、KDDI、ANAホールディングス、三井化学、島津製作所など、日韓の主要企業から出資を受けており、10社以上の企業とベンチマークの共同開発やPoC（概念実証）、RX（Robotics Transformation）プロジェクトを推進している。

　会見では、同社がKDDIやヒューマノイドロボットスタートアップEnacticと進めている協業についても説明した。KDDIとは新商品の陳列作業の自動化に向けたデータの収集／学習やフィジカルAIに必要な計算基盤やネットワークインフラの共同実証を進めている。一方、Enacticとは同社が開発したロボットアーム「OpenArm」を駆使した物流現場での実証や、OpenArmベンチマークを活用してRLDX-1の評価手法の確立を目指す。

KDDIとの協業内容（左）とEnacticとの協業内容（右）［クリックして拡大］出所：リアルワールド

⇒その他の「人工知能ニュース」の記事はこちら

物理世界と相互作用する「フィジカルAI」　AWSが語るロボット制御の進化とは
アマゾンウェブサービスジャパン（AWSジャパン）は2026年5月21日、東京都内で報道陣向けの勉強会を開催し、フィジカルAI分野におけるAWSの取り組みについて説明した。
ソニーのフィジカルAIが卓球の一流選手に勝利、自律システム「Ace」の研究成果
ソニーAIは、一流の卓球選手と対戦可能な自律システム「Ace」を開発した。高度な認識力と迅速な意思決定力を持つフィジカルAIにより、対人試合で勝利を収める性能を実証。成果は国際科学誌「Nature」に掲載された。
日立のフィジカルAI統合モデル「IWIM」の実力は？　試作ロボット2種を公開
日立製作所は「フィジカルAI体験スタジオ」の先行公開に併せて、現場で自ら学びながら動作を最適化し複雑作業を自動化するフィジカルAI技術を発表するとともに、同技術を実装した試作ロボット2種を公開した。
川崎重工が米国にフィジカルAI社会実装拠点、注力分野は医療／介護など
川崎重工は、米国シリコンバレーにフィジカルAIの社会実装を推進する拠点として「Kawasaki Physical AI Center San Jose」を開設した。
三菱電機と燈が目指す暗黙知のデータ化、現場で使えるフィジカルAI
三菱電機と燈は「協業に関する戦略発表会」を開催。AI活用による協業戦略について説明した。三菱電機の持つ現場の知見や制御技術と、燈の高度なデジタルツインやAI技術を融合し、フィジカルAIの実装を加速させる。
“熟練作業者の目”を再現　中堅製造業向けの状況認識AI「メニナルAI」とは何か
ソフトクリエイトは、中堅製造業の技術継承をサポートするAI認識サービス「メニナルAI」を発表した。