急速に進化するAI技術との融合により変わりつつあるスーパーコンピュータの現在地を、大学などの公的機関を中心とした最先端のシステムから探る本連載。第3回は、東京大学と筑波大学が共同で構築した「Miyabi」を紹介する。
いわゆるスーパーコンピュータ(スパコン)をはじめとするHPC(高性能コンピューティング)インフラは、高度なシミュレーションや創薬、ビッグデータ解析など、企業のモノづくりや事業創出に欠かせない存在となっている。さらに、生成AI(人工知能)をはじめとするAI技術の急速な進化により、これらのHPCインフラでAIをどのように活用できるようにするかも大きな課題となっている。
本連載では、日本国内のスパコン環境の一端を探るべく、大学などの公的機関を中心とした最先端のシステムを紹介していく。第2回は東京大学と筑波大学が共同で構築した「Miyabi」を取り上げる。
⇒連載「AIとの融合で進化するスパコンの現在地」バックナンバー
倍精度演算性能80.1 PFLOPSという日本トップクラスの性能を持ったスパコンが、千葉県柏市にある東京大学柏地区キャンパスで産声を上げた(図1、図2)。
システムの名前は「Miyabi」(みやび)という。高い性能で狙うのは計算科学とシミュレーションの進化である。高エネルギー物理学(素粒子)、地球/気象学、材料科学、バイオインフォマティクスなどを中心に、幅広い研究分野での成果を見込む。また、「AIを活用した科学研究の革新(AI for Science)」も目的に据える。例えば、現象や構造の予測、欠損しているデータの生成、シミュレーション精度の向上などにAIを活用し、研究を加速させていく。
Miyabiは、設置こそ東京大学の柏地区キャンパス内だが、開発、調達、運用、広報などは東京大学 情報基盤センターと筑波大学 計算科学研究センターの共同組織である「最先端共同HPC基盤施設(JCAHPC)」が担っている。2つの大学によるスパコンシステムの共同調達および共同運用に向けた試みはJCAHPCが設立された2013年から始まっており、Miyabiでも両大学の予算を投じたことで最高レベルの性能が実現された。
なお、システムは一体として運用されているが、計算資源の3分の2が東京大学に、3分の1が筑波大学に割り当てられている。利用する場合は民間企業も含めてそれぞれの大学に申し込む必要がある。
Miyabiは、2024年10〜11月に稼働テストを兼ねたLINPACKベンチマークを全系を使って行っており、その結果(46.8PFLOPS)は2024年11月18日発表のTOP500リストに掲載された。※)同リストにおいて、日本の国立大学のスパコンとしては第1位、国内における学術目的のスパコンとしては「富岳」に次ぐ第2位の性能となっている。なお、Miyabiの正式な供用開始日は2025年1月14日である。
Miyabiは、NVIDIA GH200 Grace Hopper Superchip×1120基の「Miyabi-G」(演算加速ノード群)と、Intel Xeon CPU Max 9480プロセッサー×380基の「Miyabi-C」(汎用CPUノード群)という2つのシステムから構成されている(図3、図4)。ただし、Miyabi-Gの性能は78.8PFLOPS、Miyabi-Cの性能は1.3PFLOPSであることからも分かるように、システムの中心はMiyabi-Gである。
Miyabi-Gに採用されているNVIDIA GH200 Grace Hopper Superchipは、Armアーキテクチャの72コアNVIDIA Grace CPUと、NVIDIA H100 Tensor Core GPU(コードネームHopper)とを統合した最新のAI用高性能モジュールだ。Grace CPUとHopper GPUの間は片方向当たり450GB/s(双方向の合計で900GB/s)という高速なNVLink-C2Cで接続されているのが特徴で、CPUとGPUとを別チップで構成する場合に比べて高い性能が実現されている。さらに、このNVLink-C2Cを介して、Grace CPUからGPUメモリ、あるいはHopper GPUからCPUメモリを透過的にアクセスできることも特徴である。ただし、x86プロセッサ用に書かれたソフトウェアとのバイナリーレベルでの互換性はない。
Miyabi-Gは、2基のNVIDIA GH200 Grace Hopper Superchipを搭載したSumermicro製の1Uサーバ560台で構成されていて、それぞれGrace CPU側のメモリは120GB、Hopper GPU側のメモリは96GBである(図5)。また、サーバ間のインターコネクトにはフルバイセクション構成のInfiniband NDR(200Gb/s)が採用されている。
一方のMiyabi-Cは、x86ベースのソフトウェアを実行するために用意されたシステムで、56コアで1.9GHz動作のIntel Xeon CPU Max 9480プロセッサー×2基を搭載した富士通製のPRIMERGYサーバ190台で構成されている(図2参照)。
Miyabi-GとMiyabi-Cに接続されるLustreファイルシステムは、QLC(Quad Level Cell)タイプのNANDセルを使ったオールフラッシュストレージである。また、26PBの容量を持つ、センター内共通ストレージ「Ipomoea-01」も利用できる。なお、Ipomoea(イポモエア)とはサツマイモ属の学名であり、将来的に芋づる式に拡張させていく意図を込めて名付けられている。
Copyright © ITmedia, Inc. All Rights Reserved.