東工大のスパコン「TSUBAME」の将来像とは――遠藤教授&野村准教授に聞く:AIとの融合で進化するスパコンの現在地(2)(3/3 ページ)
急速に進化するAI技術との融合により変わりつつあるスーパーコンピュータの現在地を、大学などの公的機関を中心とした最先端のシステムから探る本連載。第2回は、東京工業大学の「TSUBAME 4.0」の構築と運営を担当している同大学 教授の遠藤敏夫氏と准教授の野村哲弘氏のインタビューをお届けする。
民間企業もTSUBAME共同利用を通じて利用が可能
――TSUBAMEは「みんなのスパコン」をコンセプトに学外にも開放されてきました。そのうち民間企業の利用について教えてください。
野村 TSUBAME計算サービスの「アカウント取得方法」(図6)に記載されているように、東工大に所属していない場合は、「2.文科省の助成を受けて使うルート」「3.東工大の共同研究の一環として使うルート」および「4.TSUBAME共同利用による利用」の3つがあって、企業の場合は3または4が中心になるかと思います。なお、産業利用には成果を公開する方法と成果を公開しない方法とがあり、利用状況は「採択状況」のページにある通りです。
注)時期によっては、2口以下の小口申請を除き、TSUBAME共同利用の受付が終了している場合がある。なお、令和6年度(2024年度)に関しては2024年8月8日17時で受付を終了している。
――どのような実行環境が用意されているのでしょうか。
野村 コンパイラやデバッガとしては、GCC(GNU Compiler Collection)、Intel oneAPI(それぞれC、C++、Fortran)、Python、Ruby、Perl、NVIDIA CUDAなどを用意してあって、学外を含む全ユーザーが利用可能です。ディープラーニング関連では、AlphaFold、PyTorch、TensorFlowなども用意しています。一方の商用アプリケーションについてはライセンスの制約から学内利用のみを基本としていますので、企業で使いたい場合は自前で用意していただく必要があります※1)。
※1)TSUBAME 4.0でサポートされているアプリケーションについて
――生成AIのさまざまなモデルをカタログ化したNVIDIA NGCやNVIDIA NeMoは使えますか。
野村 2024年6月6日にNVIDIA他の協力の下で「TSUBAME 深層学習 ミニキャンプ」というイベントを行いました。そのときにメンター(サポート)役を務めたNVIDIAの方がTSUBAMEでNGCを使う方法について説明し、その内容は「TSUBAME4のGPUを最大限活用する方法」として公開されています。また、別のメンターの方が「Tsubame4.0でコンテナ環境を作る」というコンテンツを書かれていますので、こうした情報を参考にしていただければと思います。
――学外から利用する場合に、使い方のレクチャーであったり、技術サポートであったり、不明点を相談できるコミュニティーはあるのでしょうか。
野村 共同利用推進室で利用講習会を随時開催していますので、まずはそちらを受講していただければと思います。基本的には東工大の研究を加速することがTSUBAME 4.0の目的ですので、コミュニティーの運営を含めて、学外に十分なサポートを提供するのはリソース的に難しいのが今の状況ですね。後は、先ほど紹介した「TSUBAME 深層学習 ミニキャンプ」のようなイベントが不定期に開催されることがありますので、TSUBAMEのX(旧twitter)アカウント「@TSUBAME_sc」をフォローしていただければと。
将来は“待たせないスパコン”の実現を目指す
――さて、今後の展望についても伺いたいと思います。まず、東工大は2024年10月1日に東京医科歯科大学との統合によって東京科学大学になることが発表されています。
遠藤 TSUBAME 3.0の時代から学内のバイオ関連や創薬関連の研究利用がおそらく1位と2位を占めていて、東京医科歯科大学との統合による「コンバージェンス・サイエンス」の実現に向けて、さらに利用が広がればと思っていますし、スパコンインフラを提供する立場から寄与していきたいと考えています。実は既に東京医科歯科大学の希望ユーザーには東工大の学内利用と同じ料金を設定しています。
――TSUBAME 4.0が稼働したばかりですが、いずれはTSUBAME 5.0という声も出てくるかと思います。既に構想などはお持ちですか?
遠藤 難しい質問なんですけど、並列ソフトウェアを研究してきた立場から言うと、“待たせないスパコン”に向かいたいなとは思ってます。実はTSUBAME 4.0は正式稼働からわずか2カ月ほどで利用率が90%を超えてしまっていて、ジョブを投入してから結果が得られるまでかなり待っていただくような状況になっています。
野村 TSUBAME 4.0のページで利用率を公開しているんですが、空いているところはグラフの緑のところだけなんですよね(図7)。もちろんできるだけ待たせないよう工夫は行っていて、例えばノードのリソースを分割して、CPUは使うけどもGPUは使わない、といったようにジョブの特性に応じてリソースを指定できるようにはしています。
図7 TSUBAME 4.0のノードの稼働状況。青と赤はランニングノード、ピンクはウェイティングノードで、緑がアイドルノードを示す[クリックで拡大] 出所:TSUBAME 4.0「モニタリング情報」ページ
遠藤 利用率のグラフは待ち行列の専門家が見たら叫びたくなるレベルだと思うんですよ。私が研究してきた並列コンピューティングという観点では時分割を採用するというのが一つの方法ですが、時分割にすると並列シミュレーションの性能はがた落ちしてしまうので、TSUBAME 4.0では難しいかなと。
――それだけTSUBAME 4.0が頼りにされているということなんでしょうね。
遠藤 TSUBAMEは“みんなのスパコン”というキャッチフレーズで有名ですが、両輪として「先進的技術で日本を前に進める」ことも目的にしてきました。TSUBAME 1.0と1.1では旧ClearSpeed Technologyのベクトルプロセッサを、TSUBAME 1.2以降ではNVIDIAのGPUを全面的に採用し、x86 CPUがみんなのスパコンの部分を受け持ちつつ、こうしたアクセラレータが先進的技術を受け持ってきて、TOP500やGreen500といったベンチマークを含めて成果を出してきました。
ただしNVIDIAのGPUは現在ではコモディティになっていますので、将来のTSUBAMEにおいて、“みんなのスパコン”と両輪となるコンセプトを何にするかがTSUBAME 5.0以降での悩みではあるかなと思っています。
――今日はいろいろと興味深いお話を聞かせていただきました。TSUBAME 4.0によって将来の研究や開発がさらに発展していくことを願っています。お忙しいところありがとうございました。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ≫連載「AIとの融合で進化するスパコンの現在地」バックナンバー
- 東工大「TSUBAME 4.0」は“みんなのスパコン”としてどのような進化を遂げたのか
急速に進化するAI技術との融合により変わりつつあるスーパーコンピュータの現在地を、大学などの公的機関を中心とした最先端のシステムから探る本連載。第1回は、2024年4月に稼働を開始した東京工業大学の「TSUBAME 4.0」を取り上げる。 - 製造業の“みんなのスパコン”TSUBAMEのCAE利用の取り組みを聞く
東工大は「みんなのスパコン」と銘打ち、スパコン「TSUBAME」の学外利用を積極的に推進してきた。企業の使いやすさを模索してきた東工大の取り組みや、スパコンが注目されている背景などについて紹介する。 - フォークボールはなぜ落ちる? スパコンによる空力解析で謎を初めて解明
野球のピッチャーの決め球、フォークボールはなぜ落ちるのか? これまでボールの回転数が少ないことで自然落下による放物線に近い軌道を描くとされていたが、東京工業大学 学術国際情報センター 教授の青木尊之氏を代表とする研究チームがスーパーコンピュータ「TSUBAME3.0」による数値流体シミュレーションを実施し、その謎を初めて解明した。 - スパコンとOpenFOAMによるインクジェットヘッド解析の成果――CAEの有効性、認められる
セイコーインスツルでは、スーパーコンピュータ(スパコン)とOpenFOAMを使って、インクジェットヘッドの3次元解析をしている。実はスパコンを使う前は、社内でなかなかCAEの有効性が理解されなかったという。そんな中、スパコンに取り組むことになった経緯や、解析事例について話を聞いた。 - 仮想GPUを利用したVDI環境の導入により、スパコンの利活用を拡大
NVIDIAは、東京工業大学のスーパーコンピュータ「TSUBAME3.0」に導入する新しいVDIとして、「NVIDIA仮想GPU」が採用されたと発表した。VDI導入により、スパコンからの膨大なデータを、PCなど端末の画面でも利用できるようになる。