Lumex CSSの最大の特徴は、今後のモバイル機器に必須となるオンデバイスのAI処理性能を大きく高めるために、アーキテクチャの「Armv9-A」を一歩前に進めて「Armv9.3」としたことだ。
CSS for Clientまでは、CPUと連携してAIの処理を最適化する拡張機能として「SVE2」が用いられていた。Armv9.3では、サーバ/データセンター向けのプロセッサIPセットである「Neoverse」で採用した行列演算処理を得意とする「SME」を発展させたSME2を新たに開発した。
SME2によってLumex CSSのオンデバイスAI処理性能は従来のSVE2と比べて5倍に向上した。実際に、生成AIのワークロードを対象とした処理速度のベンチマークでは、音声認識モデルの「Whisper」が従来比で4.7倍、LLM(大規模言語モデル)の「Gemma3」によるエンコードで同4.7倍、音楽生成AIの「Stable Audio」で同2.8倍と大きな効果が得られているという。
またArmは、CSS for Clientと併せて、AndroidデバイスにおけるCPU上でのAIアプリケーションの処理を最適化するライブラリ「Arm KleidiAI」を発表したが、SME2もこのArm KleidiAIに対応している。特に、AndroidデバイスのAIアプリケーションに広く用いられているランタイム「LiteRT(旧TensorFlow Lite)」もSME2に対応しており、AndroidデバイスはLumex CSSの採用によるAI処理性能向上の恩恵を大きく受けられるようになっている。
SME2は、深層学習モデルなど従来のAIモデルの処理性能向上でも3〜6倍の効果が得られることを確認している。特に軽量のAIモデルでは、Lumex CSSの新たなGPUであるMali G1-Ultraよりも高い処理性能を実現できている。
Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク
よく読まれている編集記者コラム