Armのクライアント機器向け最新ソリューション「TCS23」の全貌：Arm最新動向報告（16）（1/3 ページ）

Armの最新動向について報告する本連載。今回は、2023年5月30日～6月2日に開催された「COMPUTEX TAIPEI 2023」で発表されたクライアント機器向けの最新ソリューションである「TCS23」を構成する各IPを紹介する。

LINE

Hatena

　4年ぶりに海外からの取材がオープンになった2023年の「COMPUTEX TAIPEI」で、Armはクライアント機器向けのソリューションである「TCS（Total Compute Solution）」の最新版である「TCS23」と、このTCS23を構成する「Cortex-X4」「Cortex-A720／520」「Immortalis-G720」「Mali-G720／G620」「DSU-120」などの各IPを発表した。これらの内容をまとめてご紹介したい。

⇒連載「Arm最新動向報告」バックナンバー

2021年に「Cortex-X2」などと合わせて発表された「TCS」

　TCSは2021年の「Cortex-X2」「Cortex-A710／510」などと合わせて発表された、名前の通り“Total Solution”である。単にCPU IPだけでなく、CPU間をつなぐインターコネクトのDSU（DynamIQ Shared Unit）やGPU IP、MMU（メモリ管理ユニット）、これらをつなぐコヒーレントインターコネクトと、キャッシュコヒーレントが不要な機器をつなぐネットワークインターコネクトといった、SoCの中核をなす要素をまとめて1つのパッケージとして提供するという方式である。

　2021年の発表時にロードマップも示されており（図1）、これに沿う形で2022年も製品がリリースされ、2023年も予定通りTCS23が発表されたわけだ。発表は多岐にわたるが、今回はCPUとGPUについてもう少し細かく説明したい。

図1　初公開時はTCS22や23の製品名はもちろん明示されず、コード名だけだった［クリックで拡大］

「TCS23」のCPU IP

　まずCPU IPであるが、さらに性能と効率を向上しただけでなく（図2）、以下のような大きな変更もあった。

Armv9.2aの全面サポート
32ビットの廃止

図2　このArmv9.2aの拡張項目については後述する［クリックで拡大］

　まずは性能から見てみよう。ハイエンドのCortex-X4はTCS22の「Cortex-X3」比で15％の性能改善を果たしたとする（図3）。これは猛烈な内部の強化で実現した。

図3　この“昨年のAndroidのハイエンド（＝Cortex-X3）比”というあたりにAppleへの対抗意識が透けて見える［クリックで拡大］

　フロントエンドは10命令／cycleのデコード（図4）、バックエンドは11命令同時発行のアウトオブオーダー（図5）という代物で、これに4つのAGUが組み合わされる（図6）という、もう明らかにPCやサーバ向けと言ってもおかしくない重厚な構成である。エリアサイズはCortex-X3比で10％ほど増加しているとされるが、これは微細化（既にCortex-X3はTSMCのN3Eプロセスを用いたテストチップがテープアウトしているとのこと）でカバーできる範囲である。

図4　分岐予測も2レベルのものになったが、新たに追加したのはPerceptronベースのものか？　と確認したものの詳細は教えてもらえなかった［クリックで拡大］

図5　ALU×8、Branch×3で、それとは別にFPのPipelineが4つである。ハッキリ言えば、IntelやAMDのハイエンドコアよりも重厚である［クリックで拡大］

図6　AGUが4つという時点でもう何かおかしい。いやSVEのサポートもあるからこの位は必要なのだろうが。L2が2MBというのもIntelの「Raptor Lake」並みである［クリックで拡大］

　これに対してCortex-A720だが、TCS22の「Cortex-A715」比で20％程度の性能／消費電力比向上、としており絶対的な性能向上そのものはそれほど大きくない（図7）。実際パイプライン構造そのものはCortex-A715のものを継承しつつ、細かい改良で効率を改善したとしている（図8、9）。ただArmによれば、性能／消費電力比の改善は「同一プロセス、同一動作周波数で消費電力を削減」ではなく「同一プロセス、同一消費電力で動作周波数を向上」だとしているので、最大では2割程度の性能向上が得られるという。

図7　同じ消費電力なら若干動作周波数が上がる分、性能そのものも若干上がってはいるのだが、その比率はそれほど大きくない［クリックで拡大］

図8　フロントエンドは分岐予測の効率化が主［クリックで拡大］

図9　バックエンドも細かい改良の積み重ねといった格好［クリックで拡大］

「Cortex-A520」はALU数を減らしながら性能を引き上げ

　　　　　　 | 次のページへ