「JetsonよりエッジAIに最適」、ルネサスが最新AIアクセラレータ搭載MPUを発売:人工知能ニュース(1/2 ページ)
ルネサス エレクトロニクスは、新世代のAIアクセラレータ「DRP-AI3」を搭載し、消費電力1W当たりのAI処理性能で表される電力効率で従来比10倍となる10TOPS/Wを実現した「RZ-V2H」を発売する。
ルネサス エレクトロニクスは2024年2月29日、新世代のAI(人工知能)アクセラレータ「DRP-AI3」を搭載し、消費電力1W当たりのAI処理性能で表される電力効率で従来比10倍となる10TOPS/Wを実現した「RZ/V2H」を発売すると発表した。同月開催の「ISSCC(International Solid-State Circuits Conference) 2024」で発表した最大130TOPSのAI処理性能を持つAIアクセラレータを用いており、ISSCCのような国際会議での成果発表から間を置かずに商品化することは同社としても例がないという。
ルネサスは、ビジョンAIにフォーカスしたMPU製品として「RZ/Vシリーズ」を展開しており、これまでにメインストリーム向けの「RZ/V2M」「RZ/V2MA」、エントリーモデルの「RZ/V2L」を投入している。独自の動的再構成ハードウェアである「DRP(Dynamically Reconfigurable Processor)」をベースにしたAIアクセラレータである「DRP-AI」の搭載が特徴となっており、この従来モデルのDRP-AIは電力効率が1TOPS/Wだった。今回発表のRZ/V2Hはハイエンドモデル向けに位置付けられており、新世代に刷新されたAIアクセラレータのDRP-AI3は電力効率が10倍となる10TOPS/Wに向上した。
ISSCC 2024で発表されたAIアクセラレータがベースとなるDRP-AI3は、量子化や枝刈り(Pruning)といった最新のAIモデルの軽量化手法を取り入れることで10倍の電力効率を実現している。一般的なAIモデルの学習が32ビット浮動小数点(FP32)で行われるのに対し、従来のDRP-AIは16ビット浮動小数点(FP16)への量子化には対応していた。ただし、AI技術の進化が著しいこともあって、近年は8ビット固定小数点(INT8)に量子化してもAIモデルの精度が低下しない手法が開発されており、既に広く利用されている。
DRP-AI3は、従来のFP16に加えINT8の量子化に対応するとともに、新たに枝刈りによるAIモデルの大幅な軽量化にも対応できるようになっている。INT8の量子化で電力効率2倍、枝刈りによってさらに電力効率が5倍となることで、従来比で10倍の10TOPS/Wを達成した。
なお、学習済みAIモデルを量子化や枝刈りによって軽量化するためのツールチェーンとしては、オープンソースの「Apache TVM」をベースとする「DRP TVM」を無償提供する予定だ。この他、AIアプリケーションを短期間で開発するための各種ユースケースに応じた学習済みモデルのライブラリをまとめた「AI Applications」や、AIを使ったユーザーアプリケーションの開発を短期間で行えるソフトウェア開発キット「AI SDK」も用意するという。
またDRP-AI3では、DRPとMAC(積和演算)ユニットの組み合わせから成るAIアクセラレータとは別途もう1基のDRPを用意している。画像処理に用いるオープンソースの業界標準ライブラリである「OpenCV」をDRP向けに最適化して無償提供することで、OpenCVの処理速度をCPU比で最大16倍に高速化できる。RZ/V2Hは、AIモデルと画像処理アルゴリズムの両方を高速化し、ロボット掃除機などの自律型アプリケーションで使われるVisual SLAMを高い電力効率でリアルタイムに処理できるヘテロジニアスアーキテクチャ技術も特徴となっている。
なお、RZ/V2Hは、アプリケーション処理のLinux用に最大動作周波数1.8GHzの「Cortex-A55」を4コア、高速リアルタイム処理のリアルタイムOS用に800MHz動作のCortex-R8を2コア、サブCPUとしてCortex-M33を1コア搭載している。これらのCPUとDRP-AI3の組み合わせにより、次世代ロボティクス制御に必要なビジョンAIと高速リアルタイム制御を1チップで実現しつつ、低消費電力によるファンレス動作も可能になるという。
Copyright © ITmedia, Inc. All Rights Reserved.