ルネサスのエッジAIが従来比1000倍の性能を達成、エンドポイント学習でも成果人工知能ニュース(1/2 ページ)

NEDOとルネサス エレクトロニクスが、従来比で最大10倍の電力効率となる1W当たり10TOPSを達成可能なエッジAIチップを開発。ルネサスが2018年から展開してきたDRP(動的再構成プロセッサ)ベースの「DRP-AI」を改良したもので、精度低下を抑制できるAIモデル軽量化技術として知られる「枝刈り」を適用した推論アルゴリズムを効率良く処理できる。

» 2022年12月09日 07時00分 公開
[朴尚洙MONOist]

 NEDO(新エネルギー・産業技術総合開発機構)とルネサス エレクトロニクスは2022年12月8日、オンラインで会見を開き、従来比で最大10倍の電力効率となる1W当たり10TOPS(毎秒10兆回)を達成可能なエッジAI(人工知能)チップを開発したと発表した。ルネサスが2018年から展開してきたDRP(動的再構成プロセッサ)ベースの「DRP-AI」を改良したもので、精度低下を抑制できるAIモデル軽量化技術として知られる「枝刈り」を適用した推論アルゴリズムを効率良く処理できる。加えて、AIカメラなどにおいて撮影環境に応じて低下してしまう認識精度を追加学習で改善する「エンドポイント学習技術」も新たに開発した。ルネサスは開発技術の2023年内の製品化を検討している。

開発成果 開発した次世代AIアクセラレータと従来品の電力効率比較(左)と枝刈りによる演算量削減率と認識精度との関係(右)[クリックで拡大] 出所:ルネサス エレクトロニクス

 ルネサスは、独自技術であるDRPをAIアクセラレータとして搭載した製品をArmベースの「RZファミリ」で展開してきた。2018年10月に、DRPの搭載で従来品の「RZ/A1」比でAI処理性能が10倍になった「RZ/A2M」を、2021年5月にはDRPに積和演算ユニット(AI-MAC)を一体化したDRP-AIを搭載してRZ/A2MからさらにAI処理性能を10倍にした「RZ/V2L」を投入している。今回発表したエッジAIチップは、DRP-AIの改良によってさらにAI処理性能を10倍にした次世代AIアクセラレータとなる。

 ルネサスは2017年にマイコンやマイクロプロセッサ製品にAIアクセラレータを組み込む「e-AI」の戦略を発表している。e-AIのロードマップでは、DRPを進化させていく中で10倍、10倍、10倍とAI処理性能を高めて、最終的に従来比1000倍を達成することを目標としていた。今回開発した次世代AIアクセラレータによって、従来比1000倍という目標を達成できたことになる。

 次世代AIアクセラレータにおける従来比10倍のAI処理性能の向上は、枝刈りと呼ばれるAIモデル軽量化技術に最適な演算処理を行うことで実現している。AIモデル内で不規則に存在する認識精度に影響のない演算を省略することでモデルの大幅な軽量化が可能になる枝刈りでは、ハードウェア処理の並列性と枝刈りの不規則性とに差があり、効率よく処理できないことが課題だった。

 次世代AIアクセラレータは、DRP-AIが持つ動的な回路切り替え技術などの高い柔軟性を活用することで、枝単位できめ細かく枝刈りした場合でも効率よく演算をスキップすることができる。これによって、認識精度に必要な演算のみに絞りつつ、高いハードウェア並列性を維持してAIモデルを処理できるようになった。演算量を最大90%削減する枝刈り率のAIモデルにおいて、従来技術に比べ最大で10倍の高速化を実現し、1W当たり最大で10TOPSの電力効率を達成した。また、AIモデルにもよるものの、枝刈りにより演算量を90%削減した場合でも、認識精度は3ポイント程度の低下にとどまり、ほぼ同等の精度が得られることを確認したという。

「DRP-AI」による枝刈りAIモデルの高速化 「DRP-AI」による枝刈りAIモデルの高速化[クリックで拡大] 出所:ルネサス エレクトロニクス

 ただし、AIモデルの枝刈りには専門知識が必要であり一定の手間もかかる。そこで、ユーザーが多様なAIモデルを容易に実装できるように、枝刈りモデルの最適化からハードウェア実装までエンドツーエンドで自動化するAI実装ツールも開発した。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.