三菱電機がエッジデバイスで動作する製造業向け言語モデルを開発。オープンソースのLLM(大規模言語モデル)をベースにエッジデバイスで動作可能とするとともに、タスク正解率をベースモデルの35.8%から約40ポイントの改善となる77.2%に向上した。
三菱電機は2025年6月18日、東京都内で会見を開き、エッジデバイスで動作する製造業向け言語モデルに関する新たな開発成果について説明した。パラメーター数が数億〜十数億のオープンソースLLM(大規模言語モデル)をベースに、エッジデバイスで動作可能なLLMを構築するとともに、知識の正誤を問うタスクの正解率でベースモデルの35.8%から約40ポイントの改善となる77.2%に向上できたという。今後は社内外での実機実証を進め、2026年度内の製品適用を目指す。
ChatGPTに代表されるオープンなデータで学習された汎用のLLMは、一般常識の理解は得意であるものの、特定の文脈や業界固有の知識に対する理解が浅いといわれている。また、最新バージョンのChatGPTである「GPT-4o」はAI(人工知能)モデルのパラメーター数が1兆に達するともいわれ、そのAIモデルの規模の大きさもあってクラウド上で運用されることが多い。クラウドとの通信接続が必須となると、データを外部に送信することによる情報漏えいやセキュリティ面で懸念が伴うとともに、通信が遮断される環境では利用できず、通信による遅延の影響でリアルタイム性に課題も出てくる。もちろん通信やクラウドを利用するためのランニングコストも必要になる。
このため、現場側のエッジデバイスやオンプレミス環境に実装可能なLLMのニーズも高まっているものの、AIモデルの圧縮が必要であり、このモデル圧縮により表現力が低下して性能が劣化するという課題があった。
三菱電機が今回開発した製造業向け言語モデルは2つの技術によって、エッジデバイス上に組み込み可能かつ高い精度を両立させることに成功した。1つは、製造業固有の知識を学習させる「ドメイン特化学習」とAIモデルを軽量化する技術の組み合わせによって、エッジデバイス上に組み込み可能なLLMを開発したことだ。もう1つは、このLLMをベースにして、独自の学習データ拡張技術に基づく効果的な「タスク特化学習」を施すことで、個別のユーザーに最適化する形でLLMの精度をさらに高められるようにしたことである。
実際に、今回開発した製造業向け言語モデルを用いて、三菱電機のFA製品に関する知識の正誤を問うタスク正解率で評価を実施したところ、ベースのLLMが35.8%だったのに対し、同LLMにドメイン特化学習とタスク特化学習を施したLLMは約40ポイント増の77.2%に向上した。なお、開発した製造業向け言語モデルは、NVIDIAの組み込みAIボード「Jetson AGX Orin Nano 8GB」に実装可能な規模となっている。一方、クラウドでの運用が前提となる汎用LLMのGPT-4oで同様のタスクを実施したところ、タスク正解率は52.0%にとどまった。
Copyright © ITmedia, Inc. All Rights Reserved.