Armのモバイル向け基盤が全面刷新で「Lumex」に、「SME2」でAI処理性能は5倍:人工知能ニュース(2/2 ページ)
Armがモバイル機器向けプロセッサIPセットの新たな演算サブシステム(CSS)プラットフォーム「Arm Lumex」を発表。CPUやGPUのブランド名を刷新するとともに、CPUクラスタにAIの演算処理を得意とする新たな拡張命令「SME2」を組み込むことでオンデバイスAIの処理性能を大幅に高めた。
AI処理性能と関わる拡張機能は「SVE2」から「SME2」へ進化
Lumex CSSの最大の特徴は、今後のモバイル機器に必須となるオンデバイスのAI処理性能を大きく高めるために、アーキテクチャの「Armv9-A」を一歩前に進めて「Armv9.3」としたことだ。
CSS for Clientまでは、CPUと連携してAIの処理を最適化する拡張機能として「SVE2」が用いられていた。Armv9.3では、サーバ/データセンター向けのプロセッサIPセットである「Neoverse」で採用した行列演算処理を得意とする「SME」を発展させたSME2を新たに開発した。
SME2によってLumex CSSのオンデバイスAI処理性能は従来のSVE2と比べて5倍に向上した。実際に、生成AIのワークロードを対象とした処理速度のベンチマークでは、音声認識モデルの「Whisper」が従来比で4.7倍、LLM(大規模言語モデル)の「Gemma3」によるエンコードで同4.7倍、音楽生成AIの「Stable Audio」で同2.8倍と大きな効果が得られているという。
またArmは、CSS for Clientと併せて、AndroidデバイスにおけるCPU上でのAIアプリケーションの処理を最適化するライブラリ「Arm KleidiAI」を発表したが、SME2もこのArm KleidiAIに対応している。特に、AndroidデバイスのAIアプリケーションに広く用いられているランタイム「LiteRT(旧TensorFlow Lite)」もSME2に対応しており、AndroidデバイスはLumex CSSの採用によるAI処理性能向上の恩恵を大きく受けられるようになっている。
SME2は、深層学習モデルなど従来のAIモデルの処理性能向上でも3〜6倍の効果が得られることを確認している。特に軽量のAIモデルでは、Lumex CSSの新たなGPUであるMali G1-Ultraよりも高い処理性能を実現できている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Armの最新民生機器向けIPセット「CSS for Client」は30%性能向上、3nmに最適化
Armが最新の民生機器向けプロセッサIPセットとなる「Arm CSS for Client」を発表。CPUでは「Cortex-X925」と「Cortex-A725」を新たに投入するとともに、GPUも「Immortalis-G925」に刷新し、それぞれ従来比で30%以上の性能向上を実現している。ArmのGPUは第5世代へ、「DVS」でメモリ帯域幅を40%削減
Armが民生機器向けプロダクトIPセット「Arm Total Compute Solution(TCS)」の最新パッケージ「TCS23」を発表。GPUアーキテクチャを第5世代に刷新するなどGPU性能の向上が最大の特徴となる。Armが不滅のGPU「イモータリス」を投入、民生機器向けIPセット「TCS22」も進化
Armが民生機器向けプロダクトIPセット「Arm Total Compute Solution(TCS)」の最新パッケージ「TCS22」を発表。最大の特徴は、主にスマートフォンを用いたモバイルゲーミングに求められる“ビジュアル体験”の高度化に対応するため、新たなGPUプロダクトとしてフラグシップに位置付ける「Immortalis(イモータリス)」の投入である。AIデファインドビークルに向けた演算プラットフォームを発表
Armは、AIデファインドビークルに向けた演算プラットフォーム「Arm Zena CSS」を発表した。自動車開発向けに標準化して統合したプラットフォームで、安全性を確保しつつ、ハードおよびソフトの開発期間を短縮する。シリコン戦略の標準化を促進するチップレット構造「CSA」の仕様を初公開
Armは、CSA(Chiplet System Architecture)の仕様を初公開した。システムの分割やチップレット同士を接続するための標準規格を提供し、互換性の問題を軽減する。既に60以上の企業がCSAに参加しており、シリコン戦略の標準化促進に貢献している。Armがサーバ向けプロセッサコア「Neoverse」の第3世代品を投入、シェアも急拡大
Armがクラウド/サーバ向けプロセッサコア「Neoverse」の第3世代プロダクトを発表。また、Neoverseを採用したIC設計のコストとリスクを低減し市場投入期間を短縮するためのサブシステムIP「Arm Neoverse Compute Subsystems(CSS)」の適用範囲を拡大する。