インテルがNVIDIA対抗のAIアクセラレータ「Gaudi 3」を発表、「Xeon 6」も投入人工知能ニュース(1/2 ページ)

インテルは、顧客とパートナー向けのイベント「Intel Vision 2024」において、クラウド/データセンター向けAIアクセラレータ「Gaudi」の最新モデル「Gaudi 3」と、ワークステーション/サーバ向けプロセッサ「Xeon」の最新モデルとなる「Xeon 6」を発表した。

» 2024年04月10日 06時30分 公開
[朴尚洙MONOist]

 インテル(Intel)は2024年4月9日(現地時間)、米国アリゾナ州フェニックスで開催した顧客とパートナー向けのイベント「Intel Vision 2024」において、クラウド/データセンター向けAI(人工知能)アクセラレータ「Gaudi」の最新モデル「Gaudi 3」と、ワークステーション/サーバ向けプロセッサ「Xeon」の最新モデルとなる「Xeon 6」を発表した。

「Gaudi 3」を紹介するインテル CEOのパット・ゲルシンガー(Pat Gelsinger)氏 「Gaudi 3」を紹介するインテル CEOのパット・ゲルシンガー(Pat Gelsinger)氏。同氏の横にあるのが、Gaudi 3のメザニンカードを8枚搭載するユニバーサルベースボード製品[クリックで拡大] 出所:インテル

 5nmプロセスを採用したGaudi 3は、2022年発表の前世代モデルで7nmプロセスを採用する「Gaudi 2」と比べて4倍のAI処理性能(AIモデルがBfloat16の場合)と、1.5倍のメモリ帯域幅、2倍のネットワーク帯域幅を持つ。AI処理のための64基のTPC(Tensor Processor Core)と8基のMME(Matrix Math Engine)とともに、生成AIの一つであるLLM(大規模言語モデル)を効率良く処理できるよう、帯域幅3.7TB/sのHBM2eメモリを128GB、帯域幅12.8TB/sのSRAMを96MB搭載。複数のGaudi 3で構成するシステムを構築するためのネットワーク機能として伝送速度200Gbpsの200GbEを24チャネル備えており、16レーンのPCIe 5も利用できる。

「Gaudi 3」の概要 「Gaudi 3」の概要[クリックで拡大] 出所:インテル
「Gaudi 3」のアーキテクチャ構成 「Gaudi 3」のアーキテクチャ構成[クリックで拡大] 出所:インテル

 Gaudi 3が競合製品に位置付けるのがNVIDIAのクラウド/データセンター向けGPUの「H100」と、H100のメモリをHBM3eに変更した「H200」である。Gaudi 3のベンチマークとしては、H100との比較でAI学習性能が平均1.4倍、AI推論性能についても平均1.5倍、消費電力当たりのAI推論性能では最大2.3倍となった。また、Gaudi 3より高性能のメモリを使用するH200と比べたAI推論性能でも平均1.3倍を記録したという。

「Gaudi 3」とNVIDIAの「H100」のAI処理性能の比較 「Gaudi 3」とNVIDIAの「H100」のAI処理性能の比較[クリックで拡大] 出所:インテル

 製品提供のフォームファクターは、OAM(OCP Accelerator Module)仕様に準拠したメザニンカードの「HL-325L」と、8枚のメザニンカードを搭載するユニバーサルベースボードの「HLB-325」、PCIeカードの「HL-338」の3種類となる。HL-325LとHLB-325は、2024年第2四半期(4〜6月)にデル・テクノロジーズ、HPE、レノボ、スーパーマイクロからの出荷が始まり、一般販売の開始は同年第3四半期(7〜9月期)の予定。HL-338のみ出荷時期が第4四半期(10〜12月)となる見通し。

「Gaudi 3」のフォームファクターは3種類 「Gaudi 3」のフォームファクターは3種類[クリックで拡大] 出所:インテル
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.