新エネルギー・産業技術総合開発機構とアラヤは、AIの深層学習用ニューラルネットワークモデル向けに自動で圧縮・実装できるツールを開発した。AIモデルサイズを最大で約30分の1に削減し、エッジデバイス上でリアルタイムなAI処理が可能になる。
新エネルギー・産業技術総合開発機構(NEDO)とアラヤは2019年11月18日、AI(人工知能)の深層学習用ニューラルネットワークモデル向けに自動で圧縮・実装できるツールを開発したと発表した。
新しく開発したツールは、AIモデルのサイズの圧縮と、FPGAへの実装を自動化するものだ。物体検知や意味的領域分割、姿勢推定などの深層学習モデルでは、ニューラルネットワーク入力に近い層の構造が似ていることから、これを利用して、共通化したモデルを圧縮することで演算量を削減する。
学習と圧縮を交互に繰り返しながら圧縮用パラメーターを探し、モデルサイズを最大で約30分の1に圧縮。この結果をFPGAに実装できる形式のソースコードで出力する。同ツールを、超解像モデルEDSR(baseline-x2)に対して実行したところ、全体を3.54%に圧縮した。精度については、非圧縮時の34.64dBが圧縮時には33.84dBと、ほぼ維持されていた。
モデルの圧縮とコード実装、2つの行程が自動化されたことにより、自動車やスマートフォンなどのエッジデバイスにおいて、リアルタイムでのAI処理が可能になる。電力やスペース、コストを削減し、AI開発期間の短縮にも貢献する。なお、同ツールは、2020年3月に「Pressai(プレッサイ)」としてアラヤから提供される。
両者は今後、深層学習と強化学習を組み合わせた「深層強化学習」の対応にも取り組む。ロボットやドローンなどを環境に合わせて制御できるように、環境シミュレーターと連動した学習機能を持つ深層強化学習用ニューラルネットワークモデルについても、自動で圧縮・実装できるツールを開発していく。
Copyright © ITmedia, Inc. All Rights Reserved.