いわゆるスーパーコンピュータ（スパコン）をはじめとするHPC（高性能コンピューティング）インフラは、高度なシミュレーションや創薬、ビッグデータ解析など、企業のモノづくりや事業創出に欠かせない存在となっている。さらに、生成AI（人工知能）をはじめとするAI技術の急速な進化により、これらのHPCインフラでAIをどのように活用できるようにするかも大きな課題となっている。

　本連載では、日本国内のスパコン環境の一端を探るべく、大学などの公的機関を中心とした最先端のシステムを紹介していく。第1回は、2024年4月に稼働を開始した東京工業大学の「TSUBAME 4.0」を取り上げる。【訂正あり】

4世代目となる“みんなのスパコン”が2024年4月に稼働を開始

　2024年4月1日、東京工業大学（以下、東工大）すずかけ台キャンパス（横浜市緑区）の一角で、“みんなのスパコン”の4世代目となる「TSUBAME 4.0」（図1～3）が稼働を開始した。2017年8月に稼働した3世代目の「TSUBAME 3.0」から数えて、6年8カ月ぶりの更新となる。

図1　東工大すずかけ台キャンパスで稼働した「TSUBAME 4.0」。奥にさらに2列のラックが並ぶ。最前列のラック扉には、2023年10月に行われたデザインコンテストで最優秀賞となった、だみ氏のデザインが描かれている［クリックで拡大］撮影：関行宏

図2　TSUBAME 4.0のラックに組み込まれた計算ノード。左に並ぶ連結栓から出ている黒いチューブは、CPUとGPUを冷却する水冷用のホース（in／out）である。メモリなどは空冷で、排熱はラック扉の熱交換機（左端のメッシュ部分）で冷やされる［クリックで拡大］撮影：関行宏

図3　ラック側面に揮毫された「燕」の文字。杏月書院の鎮目杏月氏の応募作が採用された［クリックで拡大］撮影：関行宏

　TSUBAMEは、日本屈指のスパコンシステムの一つであり、東工大の研究をはじめ官民の研究開発に活用されてきた。

　新しいTSUBAME 4.0の理論性能は、倍精度（FP64）の行列演算でTSUBAME 3.0の5.5倍に相当する66.8PFlops、半精度（FP16）の深層学習ではTSUBAME 3.0の20倍に相当する952PFlopsと発表されており、性能は国内トップクラスだ（図4）。流体解析、材料探索、創薬、物理シミュレーション、ディープラーニングおよび生成AIなどの研究開発を後押ししてくれるものと期待されている（図5）。

図4　TSUBAME 4.0の概略性能。AIで重要となるFP16（半精度）性能で、従来のTSUBAME 3.0比で20倍の性能を得ている［クリックで拡大］出所：東工大学術国際情報センター「TSUBAME 4.0スーパーコンピュータ利用者ガイダンス」

図5　TSUBAME 4.0は、コンバージェンスサイエンスの中核インフラとして、計算科学やシミュレーション、ビッグデータ解析、AI／深層学習などさまざまな分野で大きな成果が得られると期待されている［クリックで拡大］出所：東工大学術国際情報センター「令和6年度 TSUBAME共同利用公募説明会」資料

　ハードウェアは、CPUとしてAMD EPYC 9654×2個とNVIDIA H100 Tensor コア GPU（Hopperアーキテクチャ）×4個をそれぞれ搭載した240台のノードで構成されている。すなわち総GPU数は960だ（図6）。高価で、かつ、入手が難しいH100が960個も装備されているTSUBAME 4.0は、膨大な計算パワーを必要とするディープラーニングや生成AIの研究者にとっては垂ぜんのシステムといえるだろう。