NVIDIAは、ユーザーイベント「GTC September 2022」の基調講演において、新たなGPUアーキテクチャ「Ada Lovelaceアーキテクチャ」を発表するとともに、同アーキテクチャを採用したプロフェッショナル／コンシューマー向けGPUプラットフォーム「RTX」の第3世代品を投入することを明らかにした。

» 2022年09月21日 06時30分公開

[朴尚洙，MONOist]

　NVIDIAは2022年9月20日（現地時間）、オンラインで開催中のユーザーイベント「GTC（GPU Technology Conference） September 2022」（開催期間：同年9月19～22日）の基調講演において、新たなGPUアーキテクチャ「Ada Lovelaceアーキテクチャ」を発表するとともに、同アーキテクチャを採用したプロフェッショナル／コンシューマー向けGPUプラットフォーム「RTX」の新製品を投入することを明らかにした。現行の「Ampereアーキテクチャ」を採用する製品と比べて2～4倍のグラフィックス処理性能を実現できるという。コンシューマー向けのフラグシップとなる「RTX 4090」は、価格1599米ドルで2022年10月12日に発売される。プロフェッショナル向けの「RTX 6000 ワークステーションGPU」は同年12月の生産開始を予定している。

　NVIDIA 創業者兼CEOのジェンスン・フアン（Jensen Huang）氏は「第3世代RTX向けの新たなアーキテクチャの名前は、世界初のコンピュータプログラマーといわれる数学者のAda Lovelace氏に由来する。TSMCと共同開発したGPUに最適化した4Nプロセスを採用し、760億ものトランジスタを集積した」と語る。

「RTX 4090」を手に持つNVIDIAのジェンスン・フアン氏［クリックで拡大］出所：NVIDIA

グラフィックス処理性能を大幅に向上したAda Lovelaceアーキテクチャ

　Ada Lovelaceアーキテクチャは、主にHPC（High Performance Computing）向けとして2022年3月に発表された「Hopperアーキテクチャ」と同世代に当たる。ただし、グラフィックス処理向けのGPUとしての性能向上が図られており、前世代のAmpereアーキテクチャと比べて、シェーダーを扱うSM（Streaming Multiprocessor）を刷新し、レイトレーシング処理を担うRTコアを第3世代に進化させている。さらに、Hopperアーキテクチャで採用した第4世代Tensorコアを採用することでディープラーニングの処理性能も向上した。

「Ada Lovelaceアーキテクチャ」と従来アーキテクチャの性能比較［クリックで拡大］出所：NVIDIA

　従来比2倍の性能向上（シェーダー処理性能で83TFLOPS）を果たしたSMは、新機能としてSER（Shader Execution Reordering）を採用した。GPUのリソースに合わせてシェーディングのワークロードを動的に最適化することが可能で、レイトレーシング性能を従来比で3倍に高め、ゲーム処理のフレームレートを25％向上する効果があるという。フアン氏は「CPUにおけるアウトオブオーダー実行と同等のイノベーションになるだろう」と強調する。

　第3世代RTコアは、レイトレーシング処理で重要な「ray-triangle intersection（レイと三角形の交差判定）」の性能を倍増させるとともに、「Opacity Micromap Engine」と「Micro-Mesh Engine」という新たなハードウェアユニットを追加した。Opacity Micromap Engineは「alpha-test geometry（アルファテストジオメトリ」の演算子が2倍になり、Micro-Mesh Engineはマイクロメッシュとしてジオメトリを追加生成する機能になる。これらの結果として第3世代RTコアは、従来比で2.8倍の性能向上（レイトレーシング処理性能で191TFLOPS）を実現している。

　Hopperアーキテクチャと同じ技術としては第4世代TensorコアとTSMCの4Nプロセスがある。第4世代Tensorコアから採用したFP8（8ビット浮動小数点演算）の演算精度により、行列演算処理性能を従来比5倍以上（1.32PFLOPS）に向上した。TSMCの4Nプロセスでは、従来比2倍の電力効率化が可能になったとする。

　また、RTXは、Tensorコアに基づくディープラーニング機能を活用したゲーム向けの超解像技術「DLSS（Deep Learning Super Sampling）」が大きな特徴になっており、これも第3世代の「DLSS 3」となった。フレーム間のピクセルの方向と速度を予測する「Optical Flow Accelerator」を刷新するなどして、DLSS 3を使わない場合と比べて最大で4倍のフレームレート向上を実現できるという。

「Jetson Orin Nano」「NVIDIA IGX」「DRIVE Thor」を発表

　　　　　　 1|2 次のページへ