Armが次世代エッジAIに回答、新プロセッサ「Cortex-A320」に「Ethos-U85」を融合人工知能ニュース(1/2 ページ)

Armは、エッジ機器での生成AIやトランスフォーマーモデルの推論処理に対応する新たなエッジAIプラットフォームを発表した。Armv9アーキテクチャに基づく省フットプリントの新たなプロセッサコア「Cortex-A320」に、NPUの「Ethos-U85」を組み合わせている。

» 2025年02月27日 06時00分 公開
[朴尚洙MONOist]
アームの横山崇幸氏 アームの横山崇幸氏

 Armは2025年2月27日、エッジ機器での生成AI(人工知能)やトランスフォーマーモデルの推論処理に対応する新たなエッジAIプラットフォームを発表した。Armv9アーキテクチャに基づく省フットプリントの新たなプロセッサコア「Cortex-A320」に、NPU(Neural Processing Unit)の「Ethos-U85」を組み合わせており、10億パラメーター以上のAIモデルに対応する処理性能と、エッジ機器に求められる低消費電力性能を実現したという。

 Armに日本法人であるアーム 代表取締役社長の横山崇幸氏は「生成AIを含めてAIに対する関心の高まりは衰えを知らない。ただし、AIの全てのワークロードをクラウド上で実行することは難しく、IoT(モノのインターネット)が複雑になる中で適切な場所でAIワークロードを実行するためのエッジAIが求められている。実際に、AIのメリットを体感するのは自らの身近な環境に移植された時であり、そういう観点でもエッジAIは必須になる。セキュリティやプライバシーの観点でもAIワークロードはエッジで実行することが望ましい。今回発表するエッジAIプラットフォームにより、ArmとしてエッジAIの回答の一つを示したい」と語る。

「Coretx-A320」と「Ethos-U85」を組み合わせた新たなエッジAIプラットフォーム 「Coretx-A320」と「Ethos-U85」を組み合わせた新たなエッジAIプラットフォームは10億パラメーター以上のAIモデルに対応する処理性能を備えている[クリックで拡大] 出所:アーム

億単位のパラメーター数に対応するには64ビットアーキテクチャが必要

 Armが省電力の機器におけるエッジAIへの対応に向けて2024年9月に発表したのが、NPUの第3世代プロダクトIPであるEthos-U85である。Ethos-U85は、第2世代の「Ethos-U65」と比べて4倍となる最大4TOPSのAI処理性能を実現し、リアルタイムの画像認識も行えることを特徴としている。

アームの中島理志氏 アームの中島理志氏

 NPUの「Ethos-Uシリーズ」がマイコン向けプロセッサコアである「Cortex-Mシリーズ」と組み合わせて使うことが想定されているため、Ethos-U85は2022年4月発表の「Cortex-M85」などと組み合わせての利用が一般的になっている。アーム 応用技術部 ディレクターの中島理志氏は「エッジ機器への生成AIモデルの実装が求められるということは、パラメーター数が数百程度のディープラーニングモデルではなく、パラメーター数が億以上になるトランスフォーマーモデルを実装できなければならない。Ethos-U85はトランスフォーマーモデルに対応しているものの、FP16でパラメーター数が1億のAIモデルは2GBのメモリ容量が必要だ。このあたりまでくると32ビットアーキテクチャであるCortex-Mシリーズの4GBというメモリ上限によって対応が難しくなる。この問題を解決するには、CPU側を64ビットアーキテクチャに変更するしかない」と説明する。

 64ビットアーキテクチャのプロセッサコアとしてはアプリケーション処理用の「Cortex-Aシリーズ」があり、中でもArmv9アーキテクチャに基づく「Coretx-A720」や「Cortex-A520」は生成AIモデルに対応してきた実績もある。「ただし、Coretx-A720やCortex-A520は、バッテリー駆動するタイプのエッジ機器に適用するには消費電力が大きい。そこで新たに開発したのがCortex-A320だ」(中島氏)という。

「Cortex-Aシリーズ」が必要になる背景 32ビットアーキテクチャの「Cotex-M85」では、4GBのメモリ上限によりトランスフォーマーモデルへの対応が難しい。そこで64ビットアーキテクチャの「Cortex-Aシリーズ」が必要になる[クリックで拡大] 出所:アーム

 Cortex-A320は、IoT機器向けのCortex-Aシリーズとして開発された2012年発表の「Cortex-A53」や2018年発表の「Cortex-A53」の後継に位置付けられる、省フットプリントで低消費電力のプロダクトIPだ。Coretx-A35と比べて、機械学習の処理性能が10倍になるとともに、CPU処理性能もスカラー比で1.3倍になっている。また、パイプライン処理を最適化することで、同じArmv9アーキテクチャに基づくCortex-A520と比べて、同じ動作周波数での消費電力を半減している。

「Cortex-A320」の特徴 「Cortex-A320」の特徴[クリックで拡大] 出所:アーム
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.