世界中で大規模言語モデル(LLM)の開発成果が次々に発表されている。国内でも日本語対応のLLM開発に取り組む企業が表れているが、その1社がリコーだ。130億パラメーターの日英両言語対応LLMを作った同社に、開発の狙いや今後の戦略を聞いた。
米国のビッグテックやスタートアップによる大規模言語モデル(LLM)の開発競争が激化している。国内においても、モデルの軽量さや日本語対応に強みを持つLLM開発に取り組み、成果を公表する企業がいくつか見られる。リコーもその1社だ。同社は2024年1月31日、日本語のタスクで好成績を記録した、130億パラメーターの日英両言語対応LLMを発表した。
その後、同年3月には独自LLMを活用して機器の保守サポート業務を強化すると発表した。翌月である4月には、独自LLMを顧客ごとにカスタマイズして販売するサービスを開始している。
自社LLM開発の狙いや産業界にLLMが与え得る影響について、リコー デジタル戦略部 デジタル技術開発センター 所長の梅津良昭氏に話を聞いた。
リコーは現在、複合機などハードウェアの販売を主力とした従来の事業モデルからデジタルサービスを軸に据えたビジネスへと転換を図っている。その成長ドライバーとして重視しているのがAIだ。自然言語処理AIや画像処理AIなどを用いることで企業のデータ生成から収集、活用までのプロセスを一気通貫で支援し、ワークフローの自動化やデータドリブンな意思決定を支援するための取り組みを進めてきた。
LLMの研究開発にも継続して取り組んできた。目標とするのは、産業界での実用性に耐え得るLLMの開発だ。2021年にはBERTを活用した「仕事のAI」をサービス展開しており、2022年には60億パラメーターのLLMを開発し、翌2023年に発表した。
仕事のAIではデータの分類、見える化を行うクラスタリング機能を提供している。例えば、コールセンターでは顧客から大量の問い合わせが寄せられるが、特定のカテゴリーの問い合わせに特に素早く返答しなければならない場合もある。クラスタリング機能を使えば、そうしたテーマの問い合わせを自動判定できる。これにデータを判別する分類機能を付け加えられるノーコード開発ツールを合わせて提供してきた。
ただ、クラスタリング機能を活用すればデータの整理と格納は可能だが、それらのデータを企業が活用できる環境をいかに整備するかは別の課題だ。データから自動的にレポートを作成する、社内外の問い合わせにデータベースを検索して自動応答システムを構築するといった使い方ができれば、業務効率性はさらに高まる。
ただし、データに含まれるドキュメントが非定型でデータ形式などもバラバラな場合、LLMを適用しても実用レベルにかなう文書生成、検索の精度を得ることが難しい。リコーは強みであるOCR(光学的文字認識)技術などを使ってドキュメント読み取り、顧客が使いやすいデータ環境を整備するサポートをした上で、RAG(Retrieval-Augmented Generation)の仕組みを提供するサービスを2023年末に先行ユーザー提供を開始した。
Copyright © ITmedia, Inc. All Rights Reserved.