Lumex CSSの最大の特徴は、今後のモバイル機器に必須となるオンデバイスのAI処理性能を大きく高めるために、アーキテクチャの「Armv9-A」を一歩前に進めて「Armv9.3」としたことだ。
CSS for Clientまでは、CPUと連携してAIの処理を最適化する拡張機能として「SVE2」が用いられていた。Armv9.3では、サーバ/データセンター向けのプロセッサIPセットである「Neoverse」で採用した行列演算処理を得意とする「SME」を発展させたSME2を新たに開発した。
SME2によってLumex CSSのオンデバイスAI処理性能は従来のSVE2と比べて5倍に向上した。実際に、生成AIのワークロードを対象とした処理速度のベンチマークでは、音声認識モデルの「Whisper」が従来比で4.7倍、LLM(大規模言語モデル)の「Gemma3」によるエンコードで同4.7倍、音楽生成AIの「Stable Audio」で同2.8倍と大きな効果が得られているという。
またArmは、CSS for Clientと併せて、AndroidデバイスにおけるCPU上でのAIアプリケーションの処理を最適化するライブラリ「Arm KleidiAI」を発表したが、SME2もこのArm KleidiAIに対応している。特に、AndroidデバイスのAIアプリケーションに広く用いられているランタイム「LiteRT(旧TensorFlow Lite)」もSME2に対応しており、AndroidデバイスはLumex CSSの採用によるAI処理性能向上の恩恵を大きく受けられるようになっている。
SME2は、深層学習モデルなど従来のAIモデルの処理性能向上でも3〜6倍の効果が得られることを確認している。特に軽量のAIモデルでは、Lumex CSSの新たなGPUであるMali G1-Ultraよりも高い処理性能を実現できている。
Armの最新民生機器向けIPセット「CSS for Client」は30%性能向上、3nmに最適化
ArmのGPUは第5世代へ、「DVS」でメモリ帯域幅を40%削減
Armが不滅のGPU「イモータリス」を投入、民生機器向けIPセット「TCS22」も進化
AIデファインドビークルに向けた演算プラットフォームを発表
シリコン戦略の標準化を促進するチップレット構造「CSA」の仕様を初公開
Armがサーバ向けプロセッサコア「Neoverse」の第3世代品を投入、シェアも急拡大Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク