次いでGPU。今回Immortalis-G720およびMali-G720/G620が発表されたが、絶対性能および効率で15%アップ、システム全体での効率40%アップとされている(図15)。
そのImmortalis-G720であるが、今回アーキテクチャがGen 5に刷新された。ちなみにこのGen 5では、例えばMidgardからBifrostや、BifrostからValhallのような根本的なレンダリング方式の変更はないようで(図16)、その意味ではValhallの延長と言えなくもないのだろうが(実際何がどう変わったのか、という質問に対しては「システムの全ての部分を見直しを図って最適化した」という答えが返ってきた)、大きな違いとしてはDVS(Deferred Vertex Shading)を実装したことが挙げられる(図17)。
図16 Utgard(Gen1)/Midgard(Gen2)/Bifrost(Gen3)/Valhall(Gen4)と異なり北欧神話からコード名を付けない。なぜ、と聞いたが明確な回答はなかった。ひょっとすると開発体制が旧Falanx Microsystems A/S(ノルウェーのファブレスIPベンダー。2006年にArmノルウェーに買収された)主体から変わったのかもしれない[クリックで拡大]図18はImmortalis-G720の内部構造であるが、シェーダの構造が分解されているのが分かる。これをさらに分かりやすくしたのが図19である。全てのポリゴンに対してDVSが使われるわけではなく、必要なものに関しては従来同様のFVS(Forward Vertex Shading)が行われるが、FVSの場合は一度処理を行った結果をいったんメモリに書き出し、それを再び読みだすという処理になる(この関係でメモリアクセスが多くなる)。
対してDVSでは最終的にそれが必要になるまで処理を行わない。この方式なら一度書き戻して読み直す手間が省ける分、メモリ帯域を大幅に節約できることになるのだが、その一方で何でもかんでも後送りにすると、今度は後で処理が詰まりかねないので、うまくバランスを取る仕組みが必要になる。しかし、そのあたりの詳細については明らかにされなかった。
ただ結果として、必要となるメモリ帯域を減らしつつフレームレート向上を実現できた(図20)ということは、うまくバランスを取った実装に成功したということであろう。他にも細かな追加機能もあり(図21)、確かにこれはValhallの延長というよりもGen 5とする方が正しいというべきなのだろう。
図21 2xMSAA専用ハードウェアも搭載、というのはそういうニーズが大きかったということだろうか? 細かいところではOpenCL 3.0のフルプロファイルにも対応した(Valhallは2.0対応)[クリックで拡大]余談だが、「Super SamplingはNVIDIA/Intelに代表されるAIベースのものと、AMDに代表されるアルゴリズムベースのものがあるが、Armはどちらを選ぶのか?」と聞いたところ「そもそもSuper Samplingを提供していない」とあっさりした返事。ただPCよりも消費電力枠の厳しいモバイル向けにこそSuper Samplingが求められる気はするのだが、短期的にどうこうという話はないようだ。
ちなみにここまではImmortalis-G720の話をしてきたが、ではMali-G720/G620は?というのがこちら(図22)。要するにコアそのものは完全に同じで、コアの数で商品名が決まるという話であった。
Armの次なる2000億個出荷に向けた布石「Arm Total Solutions for IoT」の狙い
謎の多い「Armv9」について今分かっていることをまとめる
IntelとAMDを超えたArmのサーバ向けプロセッサ、実はソフトバンクのおかげ?
ArmはなぜIoT事業を切り離すのか、表と裏から読み解く
勝利を約束されたArmのAI戦略、MCUの微細化も加速させるかCopyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク
よく読まれている編集記者コラム