東芝と理化学研究所が学習済みのAIについて、演算量が異なるさまざまなシステムへの展開を可能にする「スケーラブルAI」の新技術を開発。従来技術と比べてAI性能の低下率を大幅に抑制し「世界トップレベル」を実現したという。
東芝と理化学研究所は2021年8月20日、学習済みのAI(人工知能)について、演算量が異なるさまざまなシステムへの展開を可能にする「スケーラブルAI」の新技術を開発したと発表した。従来技術と比べてAI性能の低下率を大幅に抑制し「世界トップレベル」(ニュースリリースより)を実現したという。この新技術により、ベースAIとなるフルサイズDNN(深層ニューラルネットワーク)からの性能低下を抑えつつ、適用先の機器のプロセッサや仕様に最適な演算量のエッジAIを組み込めるようになる。両者は、新技術のハードウェアアーキテクチャに対する最適化を進めるとともに、さまざまな組み込み機器やエッジデバイスへの適用を進め、実タスクでの有効性の検証を通して、2023年までの実用化を目指す。
スケーラブルAIでは、クラウドなど豊富なコンピューティングリソースで学習を行ったフルサイズDNNを基に、ニューラルネットワークの各層の重みを表す行列を、なるべく誤差が出ないように近似した小さな行列に分解して演算量を削減した「コンパクトDNN」を用いることが多い。従来技術が、コンパクトDNNを作る際に、単純に全ての層で行列の一部を一律に削除して演算量を削減するのに対して、新技術は、重要な情報が多い層の行列をできるだけ残しながら演算量を削減して、近似による誤差を低減することを特徴としている。
スケーラブルAIの学習中は、さまざまな演算量の大きさにしたコンパクトDNNとフルサイズDNNからのそれぞれの出力値と、正解との差が小さくなるようにフルサイズDNNの重みを更新する。これにより、あらゆる演算量の大きさでバランスよく学習する効果が期待できるという。学習後は、フルサイズDNNを各適用先で求められる演算量の大きさに近似したコンパクトDNNを展開できる。学習を通して演算量と性能の対応関係を可視化できるので、適用先に必要な演算性能を見積もることも可能になり、適用先システムのプロセッサなどの選択が容易になるとしている。
この新技術によるスケーラブルAIについて、一般画像の公開データセットとして広く知られているImageNetを使って、被写体に応じてデータを分類するタスクの精度評価も行った。その結果、フルサイズDNNから演算量を2分の1、3分の1、4分の1に削減した場合、分類性能の低下率は、従来のスケーラブルAIがそれぞれ2.7%、3.9%、5.0%だったのに対して、新技術ではそれぞれ1.1%、2.1%、3.3%に抑えられたという。
近年のAIは、音声認識や機械翻訳をはじめ、自動運転向けの画像認識まで、さまざまな用途で活用されており、同じ機能を持つAIでも、活用するシステムやサービスは多岐にわたることも多い。例えば、カメラ画像から人物検出を行うAIは、スマートフォンやスタンドアロン型の監視カメラに加え、AGV(無人搬送車)などで使用されている。これらのAIを利用するシステムごとにプロセッサの能力が異なる上に、AGVのように近くの人物との衝突を避けるための高精度な位置把握が求められる場合もある。
現状のAI開発は、これらのシステムに合わせて、人手で演算量と必要な精度とのバランスを試行錯誤しながら、一から開発や学習を行うのが一般的だ。しかし、開発期間やコストがかかるとともに、利用するシステムごとに異なるAIが開発され、管理が煩雑化するためスケールメリットを出しづらいことが課題となっていた。
これらの課題を解決する手法として注目を集めているのが、フルサイズDNNから利用するシステムの演算能力に応じてAIを展開するスケーラブルAIだ。しかし、演算量を落とすとAIの精度や性能が大きく低下することがデメリットになっていた。今回、東芝と理化学研究所の開発成果は、このデメリットを大きく改善するものとなっている。
なお、今回の新技術は、2017年4月に東芝と理化学研究所が設立した、理研 AIP-東芝連携センターの開発成果となる。また、2021年8月19〜26日に開催される国際会議「IJCAI(International Joint Conference on Artificial Intelligence)2021」で発表される予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.