スパコン性能ランク4部門首位の「富岳」が目指した「役立つスパコン」の意味Ansys INNOVATION CONFERENCE 2020

アンシス・ジャパンは2020年9月9〜11日の3日間、オンラインイベント「Ansys INNOVATION CONFERENCE 2020」を開催。そのスペシャルライブセッションとして、富士通 プラットフォーム開発本部 プリンシパルエンジニアの清水俊幸氏が「計算性能世界一を達成した国産スーパーコンピュータ、システム開発責任者が語る成果の陰に隠れた幾多の課題克服と技術者たちの挑戦」をテーマに講演を行った。本稿ではその内容を紹介する。

» 2020年09月30日 11時00分 公開
[長町基MONOist]

 アンシス・ジャパンは2020年9月9〜11日の3日間、オンラインイベント「Ansys INNOVATION CONFERENCE 2020」を開催。そのスペシャルライブセッションとして、富士通 プラットフォーム開発本部 プリンシパルエンジニアの清水俊幸氏が「計算性能世界一を達成した国産スーパーコンピュータ、システム開発責任者が語る成果の陰に隠れた幾多の課題克服と技術者たちの挑戦」をテーマに講演を行った。本稿ではその内容を紹介する。

スパコン性能ランキング4部門でトップに

 スーパーコンピュータ「富岳」は文部科学省の開発プロジェクトで、主体となる理化学研究所が富士通と共同で開発を進めた。Co-design(コデザイン)と呼ぶ協調設計を行ったことが大きな特徴で、2014年度から開発を開始。2021年度の共用開始を目指している。2020年6月に開催されたスパコンの国際学会「ISC2020」で「TOP500リスト」「HPCG(High Performance Conjugate Gradient)」「HPL-AI」「Graph500」という4部門のランキングでトップとなったことで多くの注目を集めた。4部門で1位となったスーパーコンピュータ(スパコン)は富岳が初。しかも、2位のスパコンに2倍から5倍の性能差を示したという。

 富士通のスパコンでは、2011年に「京」がTOP500リストで1位を記録した。京はその後7年間理化学研究所で稼働し、2019年に富岳との入れ替えにより運用を停止している。京については、以前「(スパコンの能力は)2位ではだめなのでしょうか」という、政治家の言葉があり話題を呼んだ。こうした考えに対し、清水氏は「スパコンは性能が命であり、2位や3位を目指せばいいというのは間違っている」と高い性能を目指す重要性を訴える。

 ただ一方で「だからといって、特定のランキングで1位を目指すことだけに意味があるわけではない。ランキングはスパコンの特定の性能側面を評価しているものであり、1位であることが、多くの顧客に役に立つスパコンであるということとは異なる場合もある。富岳は開発の目標として、高いアプリケーション性能、省電力、使いやすさの3つを掲げた」とランキングだけではなく「役立つ」ということを重視して開発されたことを清水氏は強調した。

 「富岳は数値目標として、京の100倍のアプリケーション性能を設定した。一方で消費電力は30〜40MWとし、高い性能を効率的な電力消費で実現する。これらの高い目標をクリアすることで結果的に世界一になれると考えていた。もちろん相手があることで、最後までどうなるかは分からなかったが、技術開発をリードするわけで周囲も意識しながら取り組まなければならない」と清水氏は考えを述べている。

 さらに、清水氏は「スパコンはすでに社会インフラの1つになっている。これを提供するのが豊かで夢のある未来の実現につながると考えている」とスパコン開発の意義を語っている。

Armアーキテクチャなどオープンな技術を活用

 富士通は、富岳の開発に至るまで、CPUの性能を強化したスパコン「PRIMEHPCシリーズ」を開発して顧客に提供してきた。富岳は同スパコンで開発したテクノロジーを多数の顧客に利用してもらうことを意識したという。アプリケーションについてもISV(Independent Software Vendor)各社と協力し、商用アプリの対応、拡大に取り組んでいる。

 富岳のスペックをみると、Armの命令セットアーキテクチャを採用しているところが大きな特徴だ。演算のピーク性能は京の11.28Petaflops(ペタフロップス)に対して、537Petaflopsと、40倍以上の性能を実現している。また、AI(人工知能)などで使用される半精度演算をサポートし、2.15Exaflops(エクサフロップス)を記録している。

photo スーパーコンピュータ「富岳」(開発・整備中)

 京と富岳を比較すると1Petaflopsのシステムを作る場合、京では合計100台のラックが必要で、設置場所も4m×32mが必要となる。しかし、富岳は1ラックで実現する。計算ノード数、IOノード数についても、ともに100倍程度性能が向上したといえる。また、ソフトウェアでも差異が大きく、富岳はArm用Linuxのオープンソースコミュニティーの活動やコラボレーションを活用することで「多数のアプリやシステムが容易に利用可能である」(清水氏)。

 富岳のアプリケーションの高速化は“世界初”の最先端技術をいくつも採用することにより実現した。Armのスパコン向け命令セットSVE(Scalable Vector Extensions)の開発に協力し、世界で初めて「Arm SVE」を実装した。メモリ幅の強化では、大量・高速に演算器にデータ供給できる積層メモリ「HBM2」を汎用CPUにおいて世界で初めて採用している。さらに、大規模での同時並列処理を可能とする「TofuインタコネクトD」を用いている。省電力化についてはCPU、システム、ソフトウェアの一体開発による巨大システムの安定稼働、稼働率向上により図った。そのため、電力抑制機能のハードウェア実装とソフトウェアによる効率的な制御を行っている。この他、富士通の最先端のCPU設計技術と最先端半導体を組み合わせて、世界トップクラスの優れた電力性能を実現した。

 使いやすさについては、スマートフォン端末やIoT機器で広く使われているArmアーキテクチャを採用したCPU「A64FX」を自社設計・開発した他、OSはサーバで広く使われているRed Hot Enterprise Linux(RHEL8.1)を採用するなど、業界標準的なオープンな技術を用いることで技術転用を容易に行えるようにしている。

スパコンはSociety5.0を実現するインフラ

 富岳は、2019年末から出荷を開始したが、新型コロナウイルス感染症(COVID-19)の流行により、世界各地でロックダウンが起こり、サプライチェーンの見直し、サプライヤーとの作業分担見直しによる納期のリカバリー、製造・組み立て順序の見直し、欠品の影響を最小限度に抑えることなどに取り組んでいるという。この結果、2020年5月には筐体搬入を完了。現在は「新型コロナウイルス対策を目的に約6分の1のリソースを提供するなど優先的な試行的利用を進めている」(清水氏)という。

 また、富士通では富岳の開発段階で得た技術を商用スパコンに展開中だ。例えばCPU「A64FX」を搭載した2種類のスパコン製品を提供している。また、海外の最先端研究機関と共同で「A64FX」の「Arm SVE」を生かしたアプリケーション評価とエコシステム開発にも取り組む。

 今後について清水氏は「富岳をはじめスパコンは社会基盤としてSociety5.0の実現の中心的インフラだと考えている。今後は、AIやデータ解析とシミュレーションの統合を進めることを考えており、これに向けた技術開発に取り組む」と意欲を示した。

⇒ 「モノづくり最前線レポート」のバックナンバーはこちら

Copyright © ITmedia, Inc. All Rights Reserved.