インテルの最新CPUアーキテクチャはより広く深く、GPUがHPCのムーンショットにモノづくり最前線レポート(2/5 ページ)

» 2021年08月23日 06時30分 公開
[朴尚洙MONOist]

「Performance Core」は高性能AIアクセラレータを搭載

 一方、性能重視のPerformance Coreでも、フロントエンドのデータ処理に関連する仕様の多くを従来比で2倍になるような強化を行っている。バックエンドのアウトオブオーダー実行を行うデコーダーはアロケーションユニットを5から6に、処理ポート数を10から12に増やし、パイプラインを埋めやすくするためにバッファーをより深くしている。L1キャッシュとメモリサブシステム、L2キャッシュも大規模化するデータに対応できるように強化した。

「Performance Core」の特徴 「Performance Core」の特徴(クリックで拡大) 出典:インテル
フロントエンドの改良点バックエンドの改良点 フロントエンド(左)とバックエンド(右)の改良点(クリックで拡大) 出典:インテル

 実際に、現行製品で最新となる第11世代の製品群に採用されている「Cypress Cove」と比較した場合に、さまざまな用途での性能を平均するとPerformance Coreの方が19%高い結果が得られた。

「Performance Core」と「Cypress Cove」の性能比較 「Performance Core」と「Cypress Cove」の性能比較(クリックで拡大) 出典:インテル

 データセンター向けのPerformance Coreには、AI(人工知能)推論用アクセラレータとなる「AMX(Advanced Matrix Extensions)」を新たに採用した。これまで用いてきた「VNNI」は、int8(8ビット整数)で1コア/1サイクル当たりに処理できる命令数が256だったが、AMXはその8倍の2048となる。土岐氏は「VNNIでも競合製品と比べて2倍の性能があったが、そこから大幅に向上した。AMXは推論だけでなく学習にも利用できるので、今後さまざまな場面でCPUによるAI活用が広がるのではないか」と強調する。Performance Coreでは、このAMXに代表されるように「Smarter(よりスマート)」にする機能も盛り込まれている。

「AMX」の概要 「AMX」の概要(クリックで拡大) 出典:インテル

 なお、Efficient CoreとPerformance Coreを採用するAlder LakeとSapphire Rapidsは、製造プロセスとしては新たに再定義したプロセスノードである「Intel 7」を採用する。

「Performance Hybrid」を目指す「Alder Lake」

 クライアントPC向けCPUのAlder Lakeは、Efficient CoreとPerformance Coreをそれぞれ複数コア搭載する構成となっており、従来で言うマルチスレッド性能を重視する「Mont」系とシングルスレッド性能を重視する「Cove」系、両方のアーキテクチャをいいところ取りした「Performance Hybrid」を目指している。

「Alder Lake」は「Performance Hybrid」を目指している 「Alder Lake」は「Performance Hybrid」を目指している(クリックで拡大) 出典:インテル

 このPerformance Hybridを実現するための仕組みになるのが「Intel Thread Director」である。土岐氏は「Intel Thread Directorでは、性能が必要な処理をPerformance Coreで、性能があまり必要ないバックグラウンドで流れているような処理をEfficient Coreで行うような制御を行うための機能だ。CPUの状態をテレメトリーで取り込んで、OS側に細かい粒度で渡すことで、そのタスクをPerformance Coreで処理するのか、Efficient Coreで処理するのか、などのスケジューリングを容易に行えるようにする」と説明する。

「Intel Thread Director」の概要 「Intel Thread Director」の概要(クリックで拡大) 出典:インテル

 Alder Lakeは、これらEfficient Core、Performance Core、Intel Thread Directorを組み合わせることで、デスクトップPCからノートPC、小型モバイル機器まで、全てのクライアントセグメントに対応できる。消費電力の範囲も9〜125Wと幅広い。メモリもDDR5、I/OもPCIe Gen5など最新の規格に対応している。

「Alder Lake」のラインアップ 「Alder Lake」のラインアップ(クリックで拡大) 出典:インテル

 なお、デスクトップ向けがPerformance Core×8+Efficient Core×8、ノートPC向けがPerformance Core×6+Efficient Core×8、小型モバイル機器向けがPerformance Core×2+Efficient Core×8という構成だ。内部の各CPUコアやGPUなどの間をつなぐインターコネクトの帯域幅は1000GB/sを実現しており、大幅な強化となっている。

「Alder Lake」の各ラインアップの構成 「Alder Lake」の各ラインアップの構成(クリックで拡大) 出典:インテル

Copyright © ITmedia, Inc. All Rights Reserved.