急速に進化するAI技術との融合により変わりつつあるスーパーコンピュータの現在地を、大学などの公的機関を中心とした最先端のシステムから探る本連載。第4回は、「Miyabi」の構築を進めた、最先端共同HPC基盤施設(JCAHPC)の朴泰祐氏、中島研吾氏、塙敏博氏、建部修見氏へのインタビューをお送りする。
前回の第3回記事では東京大学と筑波大学が共同で運用する最新スーパーコンピュータ(スパコン)「Miyabi」のシステム概要の他、両大学のスパコンの歴史、および企業利用などについて紹介した。
後編に当たる今回は、Miyabiの構築を進めた、最先端共同HPC基盤施設(JCAHPC)施設長の朴泰祐氏(筑波大学 計算科学研究センター 教授)、JCAHPC 研究開発部門 部門長の中島研吾氏(東京大学 情報基盤センター 教授)、JCAHPC 運用支援部門 部門長の塙敏博氏(同センター 教授)、同副部門長の建部修見氏(筑波大学 計算科学研究センター 教授)へのインタビューをお届けする。(インタビューは2024年10月9日に実施。塙氏のみ出張先からリモートで参加)
⇒連載「AIとの融合で進化するスパコンの現在地」バックナンバー
―― MiyabiはNVIDIA GH200 Grace Hopper Superchipを採用したスパコンとして構築され、注目を集めています。システムについて伺う前に、まずは運営母体である「最先端共同HPC基盤施設」(以下JCAHPC)について教えていただけますか。
朴氏 次期スパコンを構築するにあたって、東京大学の情報基盤センターと筑波大学の計算科学研究センターとで仕様の共通化だけではなく調達や運用も合同でやりましょう、という主旨でできた組織がJCAHPCです(第3回記事の図11)。
JCAHPCの最初のシステムが2016年12月に稼働を開始した「Oakforest-PACS」(通称OFP)で、調達予算、電力料金の負担、有償利用の収入案分、計算資源の配分などを、筑波大と東大とで1:2の比率にすることに決めて、2022年3月まで運用しました。Miyabiも同じく1:2の比率で運用する予定です。
―― Oakforest-PACSはどういったシステムだったのでしょうか。
朴氏 アクセラレータは使わずにメニーコアのCPUを採用して並列度を高めようということで、68コアを内蔵するIntel Xeon Phi 7250プロセッサー(Knights Landing世代)という野心的なプロセッサを採用しました。OFPは2016年11月のTOP500※1)で全体の6位にリストされるなど、JCAHPCとして先進的なテクノロジーを採用できたと考えています。
TOP500で「京」の10.5PFLOPSを3割近く上回る13.5PFLOPSを記録したわけですが、これは東大と筑波大のスパコン予算を合算したことで達成できた性能だと思っています。京が2019年8月に停止してから「富岳」が2021年3月に本格稼働するまで、日本の科学技術を支えたスパコンの筆頭がOFPでした。
―― OFPの後継がMiyabiですね。
塙氏 まずは2019年末に、OFPの後継についてもJCAHPCの体制を維持することを両センターで合意しました。
朴氏 OFPを運用していた間にGPUが世の中を席巻して、とくに米国の研究機関はほとんどがGPUに移行していたこともあって、OFPの後継機ではメニーコアではなくアクセラレータを使うことを考えました。ただ、メニーコア用に書かれたプログラムをGPUに移行するには時間がかかりますので、Miyabiを本調達する前の2022年6月に、NVIDIA GPUを採用することをプレ調達として決定しました。
中島氏 米国立エネルギー研究科学計算センター(NERSC)は、OFPとほぼ同じ時期に、Intel Xeon Phi 7250プロセッサーを使ってOFPとほぼ同じ規模のスパコン(Cori)を構築/運用し、その後2021年5月に、NVIDIA GPUを中心としたシステム(Perlmutter)に移行した実績を持っていました。
2019年9月に私がNERSCを訪問した際に担当者に聞いたところ、メニーコアからGPUへのアプリケーションプログラムの書き換えに最低2年以上の時間を見込んでいるとの話でした。OFPにはおよそ3000人のユーザーがいましたので、アプリケーションの移行にできるだけ早く取り掛かってもらう必要があると考え、NERSCの取り組みも参考にしながら、Miyabiの運用開始予定(2025年1月)の約30カ月前にNVIDIA GPUで行くことを決定したわけです。
Copyright © ITmedia, Inc. All Rights Reserved.