組み込みAIの性能密度が2倍以上に、「PowerVR」の新プロダクトライン人工知能ニュース(1/2 ページ)

イマジネーションテクノロジーズは、学習済みニューラルネットワーク(NN)の推論実行処理に特化したハードウェアIP「PowerVR 2NX NNA」を発表した。性能密度(回路面積当たりの処理性能)は、競合他社のDSPと専用ハードウェアIPを組み合わせたソリューションと比べて2倍、NNの処理に最適化したDSPと比べて8倍に達する。

» 2017年09月22日 08時00分 公開
[朴尚洙MONOist]

 イマジネーションテクノロジーズ(Imagination Technologies)は2017年9月21日、学習済みニューラルネットワーク(NN:Neural Network)の推論実行処理に特化したハードウェアIP「PowerVR 2NX NNA(以下、2NX NNA)」を発表した。性能密度(回路面積当たりの処理性能)は、競合他社から提案されているDSPと専用ハードウェアIPを組み合わせたソリューションと比べて2倍、NNの処理に最適化したDSPと比べて8倍に達するという、高い処理性能、低消費電力、小さい回路面積が求められるモバイル機器、ホームエンターテインメント機器、監視カメラ、自動車などに搭載されるSoC(System on Chip)向けに展開する。

 同社の「PowerVRファミリー」といえばGPUのハードウェアIPが広く知られている。今回も2NX NNAとともに、新製品となるハイエンドの「PowerVRシリーズ9XM」とミッドレンジの「PowerVRシリーズ9XE」を発表している。一方、2NX NNAは「PowerVR Vision and AI」に属するプロダクトラインになる。現時点で採用企業名は公開していないが「2020年代のSoCには2NX NNAが広く搭載されるようになるだろう」(イマジネーションテクノロジーズ PowerVR商品技術マーケティング シニアディレクタのクリス・ロングスタッフ(Chris Longstaff)氏)としている。

「PowerVRファミリー」の構成 「PowerVRファミリー」の構成。GPUとともに「2NX NNA」が属する「PowerVR Vision and AI」も展開していく(クリックで拡大) 出典:イマジネーションテクノロジーズ

「NNに特化したハードウェアIPが求められるようになるのは必然」

イマジネーションテクノロジーズのクリス・ロングスタッフ氏 イマジネーションテクノロジーズのクリス・ロングスタッフ氏

 NNは、AI(人工知能)技術として注目を集める機械学習や深層学習(ディープラーニング)の基本要素である。現時点でNNの学習については、クラウドやサーバに集積したデータを入力して行うのが一般的だ。一方、モバイル機器や監視カメラ、自動車などの組み込み機器に学習済みNNを搭載して画像認識や自然言語認識などの推論実行処理を行う、いわゆる組み込みAIについては、CPUやGPU、DSPを用いることが多い。ただし、これらの従来のプロセッサ単体では、組み込み機器に求められる高い処理性能と低い消費電力の両立は難しかった。

 ロングスタッフ氏は「IoT(モノのインターネット)におけるエッジデバイスのSoCでは、CPUやGPU、ビデオコーデックなどと同様に、NNに特化したハードウェアIPが求められるようになるのは必然であり、2NX NNAはそのために開発した」と強調する。

エッジデバイスで求められる学習済みNNの高い推論処理性能 エッジデバイスで求められる学習済みNNの高い推論処理性能。例えば、ドローンの衝突回避や、モバイル機器における画像や映像の検索やソート、解析などがある(クリックで拡大) 出典:イマジネーションテクノロジーズ

 2NX NNAはスケーラブルなアーキテクチャに基づいており、処理性能は演算精度が8ビットの場合で256〜2048MAC/クロック、16ビットの場合で128〜1024MAC/クロックとなっている。演算精度8ビットで比較すると、CPUやDSP単体の場合は100〜200MAC/クロック、DSPと専用ハードウェアIPの組み合わせの場合は1000MAC/クロック前後になる。「ケイデンス(Cadence Design Systems)やシノプシス(Synopsys)などが提案するソリューションと比べて2倍の性能密度を実現している」(ロングスタッフ氏)という。また、ファーウェイ(Huawei)やアップル(Apple)が独自に開発しているモバイル機器向けプロセッサとの比較も行っており、2NX NNAの方が高い性能密度を実現できているとした。

「2NX NNA」の機能と回路構成競合ソリューションとの性能比較 「2NX NNA」の機能と回路構成(左)と競合ソリューションとの性能比較(右)。横軸は回路面積、縦軸は処理性能(MAC/クロック)となっている(クリックで拡大) 出典:イマジネーションテクノロジーズ

 CPUやGPU、DSPの場合、NNの推論処理の実行中にメインメモリとやりとりを何度も行う必要があるが、2NX NNAはその必要が無い点もメリットになる。回路面積については、16nmプロセスで1.1mm2というある先行顧客の事例を紹介した。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.