ドローンやロボット向けの高性能で軽量なVLMを開発、8Bと2Bの2モデルを展開:人工知能ニュース
Preferred Networksは、ドローンやロボットなどの自律稼働デバイス向けに、高精度で軽量な視覚言語モデル「PLaMo-VL」を開発した。8Bモデルは日本語での画像理解や対象物の位置特定で、同規模の既存モデルの性能を上回った。
Preferred Networksは2026年4月3日、ドローン、ロボット、監視カメラなどの自律稼働デバイス向けに、高精度で軽量なVision-Language Model(VLM:視覚言語モデル)「PLaMo-VL」を開発したと発表した。また、同モデルのマルチモーダル基盤モデル2種について、モデルウェイトと技術情報ブログを公開した。
2種のモデルは、同社の生成AI(人工知能)基盤モデル「PLaMo 2.1-8B」「PLaMo 2.1-2B」に画像理解能力を統合したマルチモーダル基盤モデルの「PLaMo 2.1-8B-VL」(8Bモデル)と「PLaMo 2.1-2B-VL」(2Bモデル)だ。同社のPLaMo-VLは、エッジデバイスの限られた計算資源でも動作するよう設計されており、VQA(視覚的質問応答)とVisual Grounding(対象物の位置特定)を強化することで、物理世界の状況を「どこで何が起きているか」というレベルで理解し、判断の根拠を言語で説明できる。
8Bモデルについては、日本語VQAとVisual Groundingの両ベンチマークにおいて、同規模の既存オープンモデルを上回る性能が確認された。2Bモデルはさらに小型で手軽に試せるモデルとなっている。
同社は、PLaMo 2.1-8B-VLを用いた実証実験において、工場での複雑な作業工程の理解や、発電プラント設備における異常検出に取り組んだ。作業タスク分類では、工具の種類と位置を特定した上で作業内容を推定し、高い精度で工程を把握できることを確認した。
ドローンを用いた点検では、照明変化などの外乱に惑わされず、異常箇所をバウンディングボックスで提示することに成功した。
これらの成果は、経済産業省などが推進する生成AI開発プロジェクト「GENIAC」の第3期(2025年8月〜2026年2月)において高く評価され、GENIACモデル賞を受賞した。
Preferred Networksは今後、産業現場の特定用途に合わせた追加学習を通じて、同基盤モデルのさらなる性能向上を図り、ロボットによる作業支援や設備点検、物流管理、交通監視など、高い安全性と運用信頼性が求められる現場でのフィジカルAIの実装を加速させる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
次世代AI向け国産水冷データセンター、密閉循環で水使用効率を実質的ゼロへ
PFN、IIJら3者はAI向け水冷データセンター「AImod」を2026年4月より稼働する。水冷と空冷ハイブリッド空調によりPUE1.1台とWUE(水使用効率)の実質的ゼロを達成。次世代チップを見据え、大規模AI計算基盤のモデル確立を目指す。
自律稼働デバイス向けの軽量な大規模視覚言語モデルを開発
Preferred Networksは、自律稼働デバイス向けに軽量な大規模視覚言語モデル(VLM)「PLaMo 2.1-8B-VL」を開発した。言語情報と視覚情報を高度に統合して処理できるため、高度な画像理解が可能だ。
値札チェックや欠品確認など店頭業務を自動化するロボットを発表
Preferred Networksは、チェーンストア向け業務改善ソリューション「MiseMise」の店頭業務支援ロボット「Misebo」の予約販売を開始した。
PFNの次世代MN-CoreをRapidusが製造、さくらインターネットと国産AIインフラ構築
Preferred Networks(PFN)、Rapidus、さくらインターネットの3社は、グリーン社会に貢献する国産AIインフラの提供に向けて基本合意を締結したと発表した。
生成AIの推論処理を最大10倍高速化するAIプロセッサを開発
Preferred Networksは、生成AIの推論処理を高速化するAIプロセッサ「MN-Core L1000」の開発を開始した。生成AI利用時に特有の処理を最適化し、高速処理を可能にしている。
AI技術活用の自律移動ロボが製造現場の搬送を自動化、PLCとの連携も
Preferred Roboticsは「第3回 Factory Innovation Week[秋]」の構成展の1つである「第3回 ロボデックス[秋]」において、同社の法人向け自律移動ロボット「カチャカプロ」によるデモンストレーションを披露した。

