LLMじゃない、部品図の公差も読み解くリコーの「LMM」とは?人工知能ニュース(2/2 ページ)

» 2026年04月02日 07時30分 公開
[安藤照乃MONOist]
前のページへ 1|2       

32BでGemini 2.5 Proに匹敵する精度を達成

 リコーは2023年から独自のLLM開発に着手し、実務特化型のモデル開発を進めてきた。GENIAC第2期(2024年10月〜2025年4月)では、複雑な図表読解に強いパラメーター数で70B(700億)のLMMを開発し、基本モデルと日本語図表ベンチマークを無償公開した。

キャプション GENAIC第2期での成果[クリックで拡大] 出所:リコー

 また、2026年1月に中国のアリババクラウドが開発FしたLLMの「Qwen2.5-VL-32B-Instruct」をベースに、パラメーター数で70Bから32Bへと小型化したLMMを開発。これらの取り組みを土台として、今回のGENIAC第3期(2025年8月〜2026年2月)では、図表を視覚的に認識する段階から一歩踏み込み、その内容を論理的に解釈してQ&A形式で現場の知識を引き出せる「リーズニング(推論)性能」の強化を図った。

キャプション GENAIC第3期での成果[クリックで拡大] 出所:リコー
キャプション リーズニング性能の強化により複雑な図表理解と高度な推論を可能にした[クリックで拡大] 出所:リコー

 具体的には、AIに推論過程を日本語で出力させることで、フロー図のトレースや部品図の読み取りといった高度な論理思考力を獲得させた。例えば部品図の読み取りでは、大小の穴が描かれた設計図の中から、指定された特定の穴を見つけ出し、直径寸法を正確に読み取ることができる。単に数値だけを抽出するのではなく、貫通穴を示す点線などの周辺要素と対象部分を区別した上で、図面内の別枠に記載された公差表から該当サイズに対応する寸法公差を自律的に探し出して組み合わせる、といった判断が可能になっている。

キャプション 部品図の読み取りが可能になる[クリックで拡大] 出所:リコー

 また、AI運用でネックとなるGPUメモリの消費を抑えるため、画像の重要度を評価して画像トークンを半減させる「トークン圧縮技術」も開発。コンテキスト長を有効活用しつつ、顧客の運用コスト低減に直結する仕組みを整えた。

キャプション リコーの長谷川文寛氏

 精度比較では独自ベンチマークと公開ベンチマーク(JDocQA)の双方において、サイズの大きいオープンモデルを上回る精度を記録した。記録した。リコー デジタル技術開発センター LMM開発室 室長の長谷川文寛氏は「社内サーバで動くパラメータサイズでありながら、実用性で高い評価を得ているGoogleの『Gemini 2.5 Pro』に匹敵する精度が確認できた。オンプレミスでの社内文書活用が現実になりつつあり、社内の先人たちと議論を交わせる未来までもう少し」と手応えを語った。

キャプション ベンチマークによる精度比較[クリックで拡大] 出所:リコー

オンプレスターターキットを6月に販売開始予定

 リコーはこれらのLMMを単体で販売するのではなく、セキュアな環境で利用できるソリューションとして提供する方針だ。リコー AI事業開発センター 所長の児玉哲氏は「お客さまが利用しやすいハードウェアに入れ、スターターキットのような形で、ソリューションとして提供する」とした。

 リコーはこれらのLLM、LMMを2025年12月に発表した企業向けAIプラットフォーム「Hi.DEEN(ヒデン)」への搭載を進める。また、2026年6月に、今回開発した32BのLMMを搭載した「RICOHオンプレスターターキット」の発売を予定している。自社内のオンプレミス環境や専用データセンターで安全にAIを運用できる基盤として、導入加速を目指す。

⇒その他の「人工知能ニュース」の記事はこちら

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

特別協賛PR
スポンサーからのお知らせPR
Pickup ContentsPR
Special SitePR
あなたにおすすめの記事PR