NVIDIAがAda LovelaceアーキテクチャでRTXを第3世代に、Jetson NanoもOrin世代へ組み込み開発ニュース(1/2 ページ)

NVIDIAは、ユーザーイベント「GTC September 2022」の基調講演において、新たなGPUアーキテクチャ「Ada Lovelaceアーキテクチャ」を発表するとともに、同アーキテクチャを採用したプロフェッショナル/コンシューマー向けGPUプラットフォーム「RTX」の第3世代品を投入することを明らかにした。

» 2022年09月21日 06時30分 公開
[朴尚洙MONOist]

 NVIDIAは2022年9月20日(現地時間)、オンラインで開催中のユーザーイベント「GTC(GPU Technology Conference) September 2022」(開催期間:同年9月19〜22日)の基調講演において、新たなGPUアーキテクチャ「Ada Lovelaceアーキテクチャ」を発表するとともに、同アーキテクチャを採用したプロフェッショナル/コンシューマー向けGPUプラットフォーム「RTX」の新製品を投入することを明らかにした。現行の「Ampereアーキテクチャ」を採用する製品と比べて2〜4倍のグラフィックス処理性能を実現できるという。コンシューマー向けのフラグシップとなる「RTX 4090」は、価格1599米ドルで2022年10月12日に発売される。プロフェッショナル向けの「RTX 6000 ワークステーションGPU」は同年12月の生産開始を予定している。

 NVIDIA 創業者兼CEOのジェンスン・フアン(Jensen Huang)氏は「第3世代RTX向けの新たなアーキテクチャの名前は、世界初のコンピュータプログラマーといわれる数学者のAda Lovelace氏に由来する。TSMCと共同開発したGPUに最適化した4Nプロセスを採用し、760億ものトランジスタを集積した」と語る。

「RTX 4090」を手に持つNVIDIAのジェンスン・フアン氏 「RTX 4090」を手に持つNVIDIAのジェンスン・フアン氏[クリックで拡大] 出所:NVIDIA

グラフィックス処理性能を大幅に向上したAda Lovelaceアーキテクチャ

 Ada Lovelaceアーキテクチャは、主にHPC(High Performance Computing)向けとして2022年3月に発表された「Hopperアーキテクチャ」と同世代に当たる。ただし、グラフィックス処理向けのGPUとしての性能向上が図られており、前世代のAmpereアーキテクチャと比べて、シェーダーを扱うSM(Streaming Multiprocessor)を刷新し、レイトレーシング処理を担うRTコアを第3世代に進化させている。さらに、Hopperアーキテクチャで採用した第4世代Tensorコアを採用することでディープラーニングの処理性能も向上した。

「Ada Lovelaceアーキテクチャ」と従来アーキテクチャの性能比較 「Ada Lovelaceアーキテクチャ」と従来アーキテクチャの性能比較[クリックで拡大] 出所:NVIDIA

 従来比2倍の性能向上(シェーダー処理性能で83TFLOPS)を果たしたSMは、新機能としてSER(Shader Execution Reordering)を採用した。GPUのリソースに合わせてシェーディングのワークロードを動的に最適化することが可能で、レイトレーシング性能を従来比で3倍に高め、ゲーム処理のフレームレートを25%向上する効果があるという。フアン氏は「CPUにおけるアウトオブオーダー実行と同等のイノベーションになるだろう」と強調する。

 第3世代RTコアは、レイトレーシング処理で重要な「ray-triangle intersection(レイと三角形の交差判定)」の性能を倍増させるとともに、「Opacity Micromap Engine」と「Micro-Mesh Engine」という新たなハードウェアユニットを追加した。Opacity Micromap Engineは「alpha-test geometry(アルファテストジオメトリ」の演算子が2倍になり、Micro-Mesh Engineはマイクロメッシュとしてジオメトリを追加生成する機能になる。これらの結果として第3世代RTコアは、従来比で2.8倍の性能向上(レイトレーシング処理性能で191TFLOPS)を実現している。

 Hopperアーキテクチャと同じ技術としては第4世代TensorコアとTSMCの4Nプロセスがある。第4世代Tensorコアから採用したFP8(8ビット浮動小数点演算)の演算精度により、行列演算処理性能を従来比5倍以上(1.32PFLOPS)に向上した。TSMCの4Nプロセスでは、従来比2倍の電力効率化が可能になったとする。

 また、RTXは、Tensorコアに基づくディープラーニング機能を活用したゲーム向けの超解像技術「DLSS(Deep Learning Super Sampling)」が大きな特徴になっており、これも第3世代の「DLSS 3」となった。フレーム間のピクセルの方向と速度を予測する「Optical Flow Accelerator」を刷新するなどして、DLSS 3を使わない場合と比べて最大で4倍のフレームレート向上を実現できるという。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.