Armのクライアント機器向け最新ソリューション「TCS23」の全貌Arm最新動向報告(16)(1/3 ページ)

Armの最新動向について報告する本連載。今回は、2023年5月30日〜6月2日に開催された「COMPUTEX TAIPEI 2023」で発表されたクライアント機器向けの最新ソリューションである「TCS23」を構成する各IPを紹介する。

» 2023年07月10日 07時00分 公開
[大原雄介MONOist]

 4年ぶりに海外からの取材がオープンになった2023年の「COMPUTEX TAIPEI」で、Armはクライアント機器向けのソリューションである「TCS(Total Compute Solution)」の最新版である「TCS23」と、このTCS23を構成する「Cortex-X4」「Cortex-A720/520」「Immortalis-G720」「Mali-G720/G620」「DSU-120」などの各IPを発表した。これらの内容をまとめてご紹介したい。

⇒連載「Arm最新動向報告」バックナンバー

2021年に「Cortex-X2」などと合わせて発表された「TCS」

 TCSは2021年の「Cortex-X2」「Cortex-A710/510」などと合わせて発表された、名前の通り“Total Solution”である。単にCPU IPだけでなく、CPU間をつなぐインターコネクトのDSU(DynamIQ Shared Unit)やGPU IP、MMU(メモリ管理ユニット)、これらをつなぐコヒーレントインターコネクトと、キャッシュコヒーレントが不要な機器をつなぐネットワークインターコネクトといった、SoCの中核をなす要素をまとめて1つのパッケージとして提供するという方式である。

 2021年の発表時にロードマップも示されており(図1)、これに沿う形で2022年も製品がリリースされ、2023年も予定通りTCS23が発表されたわけだ。発表は多岐にわたるが、今回はCPUとGPUについてもう少し細かく説明したい。

図1 初公開時はTCS22や23の製品名はもちろん明示されず、コード名だけだった 図1 初公開時はTCS22や23の製品名はもちろん明示されず、コード名だけだった[クリックで拡大]

「TCS23」のCPU IP

 まずCPU IPであるが、さらに性能と効率を向上しただけでなく(図2)、以下のような大きな変更もあった。

  • Armv9.2aの全面サポート
  • 32ビットの廃止
図2 このArmv9.2aの拡張項目については後述する 図2 このArmv9.2aの拡張項目については後述する[クリックで拡大]

 まずは性能から見てみよう。ハイエンドのCortex-X4はTCS22の「Cortex-X3」比で15%の性能改善を果たしたとする(図3)。これは猛烈な内部の強化で実現した。

図3 この“昨年のAndroidのハイエンド(=Cortex-X3)比”というあたりにAppleへの対抗意識が透けて見える 図3 この“昨年のAndroidのハイエンド(=Cortex-X3)比”というあたりにAppleへの対抗意識が透けて見える[クリックで拡大]

 フロントエンドは10命令/cycleのデコード(図4)、バックエンドは11命令同時発行のアウトオブオーダー(図5)という代物で、これに4つのAGUが組み合わされる(図6)という、もう明らかにPCやサーバ向けと言ってもおかしくない重厚な構成である。エリアサイズはCortex-X3比で10%ほど増加しているとされるが、これは微細化(既にCortex-X3はTSMCのN3Eプロセスを用いたテストチップがテープアウトしているとのこと)でカバーできる範囲である。

図4 分岐予測も2レベルのものになったが、新たに追加したのはPerceptronベースのものか? と確認したものの詳細は教えてもらえなかった[クリックで拡大]
図5 ALU×8、Branch×3で、それとは別にFPのPipelineが4つである 図5 ALU×8、Branch×3で、それとは別にFPのPipelineが4つである。ハッキリ言えば、IntelやAMDのハイエンドコアよりも重厚である[クリックで拡大]
図6 AGUが4つという時点でもう何かおかしい 図6 AGUが4つという時点でもう何かおかしい。いやSVEのサポートもあるからこの位は必要なのだろうが。L2が2MBというのもIntelの「Raptor Lake」並みである[クリックで拡大]

 これに対してCortex-A720だが、TCS22の「Cortex-A715」比で20%程度の性能/消費電力比向上、としており絶対的な性能向上そのものはそれほど大きくない(図7)。実際パイプライン構造そのものはCortex-A715のものを継承しつつ、細かい改良で効率を改善したとしている(図8、9)。ただArmによれば、性能/消費電力比の改善は「同一プロセス、同一動作周波数で消費電力を削減」ではなく「同一プロセス、同一消費電力で動作周波数を向上」だとしているので、最大では2割程度の性能向上が得られるという。

図7 同じ消費電力なら若干動作周波数が上がる分、性能そのものも若干上がってはいるのだが、その比率はそれほど大きくない 図7 同じ消費電力なら若干動作周波数が上がる分、性能そのものも若干上がってはいるのだが、その比率はそれほど大きくない[クリックで拡大]
図8 フロントエンドは分岐予測の効率化が主 図8 フロントエンドは分岐予測の効率化が主[クリックで拡大]
図9 バックエンドも細かい改良の積み重ねといった格好 図9 バックエンドも細かい改良の積み重ねといった格好[クリックで拡大]
       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.