インテルのGPU「Arc Aシリーズ」、CPUや内蔵GPUと連携しAI処理を効率化:組み込み開発ニュース(1/3 ページ)
インテル日本法人が、ディスクリートGPU「Arc Aシリーズ」の特徴や事業展開などについて説明。GPUアーキテクチャ「Xe HPG」の他、CPUや内蔵GPUと連携して電力消費を抑え、性能向上も可能にする機能「Deep Link」などについて紹介した。
米国インテル(Intel)は2022年3月30日(現地時間)、同社が開発を進めてきたディスクリートGPU「Arc Aシリーズ」を搭載するノートPCが発売されたことを発表した。これに合わせてインテル日本法人は同年3月31日、オンラインで会見を開き、Arc Aシリーズの特徴や事業展開などについて説明した。
Arc Aシリーズは、“モバイルグラフィックス”に位置付けられており、今回ノートPCに搭載された拡張ゲーミング向けの「Arc 3」、ミッドレンジとなる先進ゲーミング向けの「Arc 5」、ハイエンドの高性能ゲーミング向けの「Arc 7」から構成されている。
GPUアーキテクチャとしてはこれまで展開してきた「Xe」で最新となる「Xe HPG」を採用。Xe HPGでは、処理ユニットの単位を従来のEU(Execution Unit)から「Xe-core」に改めた。Xe-coreは、16個のベクトルエンジンと16個のマトリクスエンジン、192KBのL1キャッシュなどから構成されている。さらに、このXe-coreを4つと専用レイトレーシングユニット、レンダリング関連の固定機能などを1つにまとめたものをレンダースライス(Render Slice)とし、さらにレンダースライスはL2キャッシュを介して最大8つまで接続できる。
Xe-coreのベクトルエンジンは、1クロック当たりの演算数がFP32(32ビット浮動小数点)で16回、FP16(16ビット浮動小数点)で32回、INT8(8ビット固定小数点)で64回であり、FP32/16とINT8の演算を同時に行えるようになっている。一方、AI(人工知能)の処理性能向上に向けて新たに開発したマトリクスエンジン「XMX」は、1クロック当たりの演算数がFP16/BFLOAT16(深層学習用の浮動小数点精度)で128回、INT8で256回、INT4(4ビット固定小数点)/INT2(2ビット固定小数点)で512回となっている。
XMXでは、ベクトルエンジンにも搭載されている基本的なMAC(積和演算)と比べてAI処理を4倍に高速化できるDP4a命令を並列でパイプライン処理できる「シストリックアレイ」を採用することで、通常のMACと比べて最大16倍もの演算能力を実現した。
Xe-coreでは、ベクトルエンジンとXMXのペアがロックステップ方式で動作するとともに、FP、INT、XMXへの演算命令を同時発行できるため、インテルの従来のグラフィックスアーキテクチャと比べて高いAI演算処理性能を発揮できるというわけだ。
XMXを実アプリケーションに適用したものが、これまでも紹介されてきた「Xe SS(Super Sampling)」である。従来の超解像技術にAI処理を用いることで、低解像度のフレームを高解像度のフレームにアップスケールしてくれる。表示の解像度などの品質とフレームレートなどの性能のトレードオフで苦慮するゲームのグラフィックス性能にとってうれしい機能だ。現時点で14のゲームタイトルがXe SSに対応する予定で、2022年初夏にリリースされるという。
Copyright © ITmedia, Inc. All Rights Reserved.