インテルは、顧客とパートナー向けのイベント「Intel Vision 2024」において、クラウド/データセンター向けAIアクセラレータ「Gaudi」の最新モデル「Gaudi 3」と、ワークステーション/サーバ向けプロセッサ「Xeon」の最新モデルとなる「Xeon 6」を発表した。
インテル(Intel)は2024年4月9日(現地時間)、米国アリゾナ州フェニックスで開催した顧客とパートナー向けのイベント「Intel Vision 2024」において、クラウド/データセンター向けAI(人工知能)アクセラレータ「Gaudi」の最新モデル「Gaudi 3」と、ワークステーション/サーバ向けプロセッサ「Xeon」の最新モデルとなる「Xeon 6」を発表した。
5nmプロセスを採用したGaudi 3は、2022年発表の前世代モデルで7nmプロセスを採用する「Gaudi 2」と比べて4倍のAI処理性能(AIモデルがBfloat16の場合)と、1.5倍のメモリ帯域幅、2倍のネットワーク帯域幅を持つ。AI処理のための64基のTPC(Tensor Processor Core)と8基のMME(Matrix Math Engine)とともに、生成AIの一つであるLLM(大規模言語モデル)を効率良く処理できるよう、帯域幅3.7TB/sのHBM2eメモリを128GB、帯域幅12.8TB/sのSRAMを96MB搭載。複数のGaudi 3で構成するシステムを構築するためのネットワーク機能として伝送速度200Gbpsの200GbEを24チャネル備えており、16レーンのPCIe 5も利用できる。
Gaudi 3の競合製品として位置付けられているのがNVIDIAのクラウド/データセンター向けGPU「H100」と、H100のメモリをHBM3eに変更した「H200」である。Gaudi 3のベンチマークとしては、H100との比較でAI学習性能が平均1.4倍、AI推論性能についても平均1.5倍、消費電力当たりのAI推論性能では最大2.3倍となった。また、Gaudi 3より高性能のメモリを使用するH200と比べたAI推論性能でも平均1.3倍を記録したという。
製品提供のフォームファクターは、OAM(OCP Accelerator Module)仕様に準拠したメザニンカードの「HL-325L」と、8枚のメザニンカードを搭載するユニバーサルベースボードの「HLB-325」、PCIeカードの「HL-338」の3種類となる。HL-325LとHLB-325は、2024年第2四半期(4〜6月)にデル・テクノロジーズ、HPE、レノボ、スーパーマイクロからの出荷が始まり、一般販売の開始は同年第3四半期(7〜9月期)の予定。HL-338のみ出荷時期が第4四半期(10〜12月)となる見通し。
Copyright © ITmedia, Inc. All Rights Reserved.