Armのクライアント機器向け最新ソリューション「TCS23」の全貌Arm最新動向報告(16)(3/3 ページ)

» 2023年07月10日 07時00分 公開
[大原雄介MONOist]
前のページへ 1|2|3       

「TCS23」のGPU IP

 次いでGPU。今回Immortalis-G720およびMali-G720/G620が発表されたが、絶対性能および効率で15%アップ、システム全体での効率40%アップとされている(図15)。

図15 このシステム全体での効率は、メモリアクセスを大幅に効率化した事が貢献しているとされる 図15 このシステム全体での効率は、メモリアクセスを大幅に効率化した事が貢献しているとされる[クリックで拡大]

 そのImmortalis-G720であるが、今回アーキテクチャがGen 5に刷新された。ちなみにこのGen 5では、例えばMidgardからBifrostや、BifrostからValhallのような根本的なレンダリング方式の変更はないようで(図16)、その意味ではValhallの延長と言えなくもないのだろうが(実際何がどう変わったのか、という質問に対しては「システムの全ての部分を見直しを図って最適化した」という答えが返ってきた)、大きな違いとしてはDVS(Deferred Vertex Shading)を実装したことが挙げられる(図17)。

図16 Utgard(Gen1)/Midgard(Gen2)/Bifrost(Gen3)/Valhall(Gen4)と異なり北欧神話からコード名を付けない 図16 Utgard(Gen1)/Midgard(Gen2)/Bifrost(Gen3)/Valhall(Gen4)と異なり北欧神話からコード名を付けない。なぜ、と聞いたが明確な回答はなかった。ひょっとすると開発体制が旧Falanx Microsystems A/S(ノルウェーのファブレスIPベンダー。2006年にArmノルウェーに買収された)主体から変わったのかもしれない[クリックで拡大]
図17 GPU自身の省電力化も多少はあるが、それよりもメモリアクセスの頻度を大幅に抑えたのが効いている 図17 GPU自身の省電力化も多少はあるが、それよりもメモリアクセスの頻度を大幅に抑えたのが効いている[クリックで拡大]

 図18はImmortalis-G720の内部構造であるが、シェーダの構造が分解されているのが分かる。これをさらに分かりやすくしたのが図19である。全てのポリゴンに対してDVSが使われるわけではなく、必要なものに関しては従来同様のFVS(Forward Vertex Shading)が行われるが、FVSの場合は一度処理を行った結果をいったんメモリに書き出し、それを再び読みだすという処理になる(この関係でメモリアクセスが多くなる)。

図18 従来だとFrontendはWarp Managerの前ではなく、この図で強いて言えばExecution Engineの中にあったはずのものである 図18 従来だとFrontendはWarp Managerの前ではなく、この図で強いて言えばExecution Engineの中にあったはずのものである[クリックで拡大]
図19 FVSのフローだとVaryingsやShaded Positionsは一度メモリに書いて、後でまた読み直しているのが分かる 図19 FVSのフローだとVaryingsやShaded Positionsは一度メモリに書いて、後でまた読み直しているのが分かる。DVSだとこれが省けるわけだ[クリックで拡大]

 対してDVSでは最終的にそれが必要になるまで処理を行わない。この方式なら一度書き戻して読み直す手間が省ける分、メモリ帯域を大幅に節約できることになるのだが、その一方で何でもかんでも後送りにすると、今度は後で処理が詰まりかねないので、うまくバランスを取る仕組みが必要になる。しかし、そのあたりの詳細については明らかにされなかった。

 ただ結果として、必要となるメモリ帯域を減らしつつフレームレート向上を実現できた(図20)ということは、うまくバランスを取った実装に成功したということであろう。他にも細かな追加機能もあり(図21)、確かにこれはValhallの延長というよりもGen 5とする方が正しいというべきなのだろう。

図20 書き込みのBandwidthを31%削減できたのはかなり大きなインパクトになると考えられる 図20 書き込みのBandwidthを31%削減できたのはかなり大きなインパクトになると考えられる[クリックで拡大]
図21 2xMSAA専用ハードウェアも搭載、というのはそういうニーズが大きかったということだろうか 図21 2xMSAA専用ハードウェアも搭載、というのはそういうニーズが大きかったということだろうか? 細かいところではOpenCL 3.0のフルプロファイルにも対応した(Valhallは2.0対応)[クリックで拡大]

 余談だが、「Super SamplingはNVIDIA/Intelに代表されるAIベースのものと、AMDに代表されるアルゴリズムベースのものがあるが、Armはどちらを選ぶのか?」と聞いたところ「そもそもSuper Samplingを提供していない」とあっさりした返事。ただPCよりも消費電力枠の厳しいモバイル向けにこそSuper Samplingが求められる気はするのだが、短期的にどうこうという話はないようだ。

 ちなみにここまではImmortalis-G720の話をしてきたが、ではMali-G720/G620は?というのがこちら(図22)。要するにコアそのものは完全に同じで、コアの数で商品名が決まるという話であった。

図22 ちなみにValhall世代ではMaliはレイトレーシングの機能がなく、Immortalisのみ有効という話であった 図22 ちなみにValhall世代ではMaliはレイトレーシングの機能がなく、Immortalisのみ有効という話であったが、Gen 5でもこれは継承されるもよう。まぁコア数が少ないとレイトレーシングを有効にしてもまともに動かないのはPC向けGPUでよく分かっている[クリックで拡大]
前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.