「IOWN」はLLMに何をもたらすか、NTTが進める次世代通信とAIの研究開発モノづくり最前線レポート(2/3 ページ)

» 2023年11月15日 09時30分 公開
[池谷翼MONOist]

軽量さなどを特徴とするLLM「tsuzumi」

 tsuzumiは2023年11月1日にNTTが発表した同社独自のLLMで、モデルの軽量さと日本語処理能力の高さなどを特徴としている。「軽量版」(70億パラメーター)と「超軽量版」(6億パラメーター)の2種類を発表しており、特に超軽量版はOpenAIのLLM「GPT-3」(175億パラメーター)と比較すると約300分の1にサイズを抑えている。

 モデルの軽量化は学習/推論コストの低減につながる。また巨大なモデルの作成に当たっては1回の学習プロセスで約1300MWhと「原子力発電所1基分(GPT-3の場合)」以上に相当し得る膨大な電力が必要だが、それを一定程度抑制することにもつながる。

tsuzumiの軽量化によるメリット[クリックして拡大] 出所:NTT

 日本語の処理性能においては、軽量版はGPT-3.5の他、代表的な国産LLMの中でトップクラスの性能を示すことを確認できたとする。また英語の処理性能でもMetaのLLM「Llama2」(70億パラメーター)と同程度の性能を実現している。

日本語と英語の処理性能で良好な結果を記録[クリックして拡大] 出所:NTT

 加えてNTTはtsuzumiの特徴として、柔軟なチューニングが可能であることやマルチモーダル性を持つことも挙げている。例えば、基盤モデルに業界特化型のチューニングを施すことで、学習時点では存在しなかった業界における最新情報にも対応するようになる。また、マルチモーダル性によって、自然言語だけでなく、文書や画像を提示しながらの質問にも応答できるようになる。図版の説明をさせることや、請求書の画像から合計金額を抜き出すことも可能だ。

柔軟なチューニングが可能な上(左)、マルチモーダル性を備えている(右)[クリックして拡大] 出所:NTT

海外データセンター間の100kmをAPN接続する実証実験

 島田氏はIOWNやtsuzumiを用いたユースケースを紹介した。労働力不足や環境/エネルギー問題、高齢化社会の進展といった社会課題解決にこれらの技術がどのように貢献するかといった切り口で解説した。

NTTの島田氏

 まずIOWNに関しては、建設業界において建設機械のリモート化を実現するシステム向けのAPN導入や、放送局とスタジアムなどの撮影現場をAPNで接続する「リモートプロダクション」実現に向けた取り組みなどが進んでいる。前者は竹中工務店やリモート化基盤を提供するジザイエなどと、後者は2023年11月13日にリモートプロダクションに関する連携協定を締結したソニーなどと共同で進めている。大容量かつ低遅延の通信によって、現場での作業に近い環境を遠隔で実現できる。これによって労働力不足の解決に貢献することが期待される。

建設現場のリモート化(左)や、リモートプロダクションの取り組み(右)でAPN活用を検討する[クリックして拡大] 出所:NTT

 分散型データセンタの促進にも貢献し得る。現在、Oracle(オラクル)のクラウド基盤とNTTグループのデータセンターをAPNで接続する実証実験が進んでいる。重要な情報はデータセンターに置きつつ、分析などで必要なものだけをクラウドに上げてリアルタイム連携できるかなどを確認している。さらに、米国や英国にあるNTTのデータセンター間でのAPN接続の実証実験も進めている。米国は10km、英国は100km離れたデータセンターを1つのデータセンターとして運用できるかを検証するもので、2023年度中に完了する予定だ。

オラクルとの取り組み(左)や、海外でのデータセンター間の接続(右)でAPNを用いた実証実験を推進[クリックして拡大] 出所:NTT

 tsuzumiについてはコールセンターでの生産性向上や電子カルテのデータ構造化といった用途を挙げた。コールセンターの用途では、東京海上日動が事故対応部門において、tsuzumiを使うことでオペレーターの年間事務労働時間の50%削減を目指している事例がある。電子カルテに関しては、京都大学医学部附属病院で電子カルテの内容を読解してフォーマットに落とし込むといった使い方がすでになされているという。

コールセンターの業務効率化(左)や、電子カルテのデータ構造化(右)などに貢献し得る[クリックして拡大] 出所:NTT

Copyright © ITmedia, Inc. All Rights Reserved.