東工大のスパコン「TSUBAME」の将来像とは――遠藤教授&野村准教授に聞くAIとの融合で進化するスパコンの現在地(2)(3/3 ページ)

» 2024年09月09日 07時00分 公開
[関行宏MONOist]
前のページへ 1|2|3       

民間企業もTSUBAME共同利用を通じて利用が可能

――TSUBAMEは「みんなのスパコン」をコンセプトに学外にも開放されてきました。そのうち民間企業の利用について教えてください。

野村 TSUBAME計算サービスの「アカウント取得方法」(図6)に記載されているように、東工大に所属していない場合は、「2.文科省の助成を受けて使うルート」「3.東工大の共同研究の一環として使うルート」および「4.TSUBAME共同利用による利用」の3つがあって、企業の場合は3または4が中心になるかと思います。なお、産業利用には成果を公開する方法と成果を公開しない方法とがあり、利用状況は「採択状況」のページにある通りです。

図6 図6 TSUBAMEの利用に必要なアカウント取得方法[クリックで拡大] 出所:東工大 学術国際情報センター

注)時期によっては、2口以下の小口申請を除き、TSUBAME共同利用の受付が終了している場合がある。なお、令和6年度(2024年度)に関しては2024年8月8日17時で受付を終了している。

――どのような実行環境が用意されているのでしょうか。

野村 コンパイラやデバッガとしては、GCC(GNU Compiler Collection)、Intel oneAPI(それぞれC、C++、Fortran)、Python、Ruby、Perl、NVIDIA CUDAなどを用意してあって、学外を含む全ユーザーが利用可能です。ディープラーニング関連では、AlphaFold、PyTorch、TensorFlowなども用意しています。一方の商用アプリケーションについてはライセンスの制約から学内利用のみを基本としていますので、企業で使いたい場合は自前で用意していただく必要があります※1)

※1)TSUBAME 4.0でサポートされているアプリケーションについて

――生成AIのさまざまなモデルをカタログ化したNVIDIA NGCやNVIDIA NeMoは使えますか。

野村 2024年6月6日にNVIDIA他の協力の下で「TSUBAME 深層学習 ミニキャンプ」というイベントを行いました。そのときにメンター(サポート)役を務めたNVIDIAの方がTSUBAMEでNGCを使う方法について説明し、その内容は「TSUBAME4のGPUを最大限活用する方法」として公開されています。また、別のメンターの方が「Tsubame4.0でコンテナ環境を作る」というコンテンツを書かれていますので、こうした情報を参考にしていただければと思います。

――学外から利用する場合に、使い方のレクチャーであったり、技術サポートであったり、不明点を相談できるコミュニティーはあるのでしょうか。

野村 共同利用推進室で利用講習会を随時開催していますので、まずはそちらを受講していただければと思います。基本的には東工大の研究を加速することがTSUBAME 4.0の目的ですので、コミュニティーの運営を含めて、学外に十分なサポートを提供するのはリソース的に難しいのが今の状況ですね。後は、先ほど紹介した「TSUBAME 深層学習 ミニキャンプ」のようなイベントが不定期に開催されることがありますので、TSUBAMEのX(旧twitter)アカウント「@TSUBAME_sc」をフォローしていただければと。

将来は“待たせないスパコン”の実現を目指す

――さて、今後の展望についても伺いたいと思います。まず、東工大は2024年10月1日に東京医科歯科大学との統合によって東京科学大学になることが発表されています。

遠藤 TSUBAME 3.0の時代から学内のバイオ関連や創薬関連の研究利用がおそらく1位と2位を占めていて、東京医科歯科大学との統合による「コンバージェンス・サイエンス」の実現に向けて、さらに利用が広がればと思っていますし、スパコンインフラを提供する立場から寄与していきたいと考えています。実は既に東京医科歯科大学の希望ユーザーには東工大の学内利用と同じ料金を設定しています。

――TSUBAME 4.0が稼働したばかりですが、いずれはTSUBAME 5.0という声も出てくるかと思います。既に構想などはお持ちですか?

遠藤 難しい質問なんですけど、並列ソフトウェアを研究してきた立場から言うと、“待たせないスパコン”に向かいたいなとは思ってます。実はTSUBAME 4.0は正式稼働からわずか2カ月ほどで利用率が90%を超えてしまっていて、ジョブを投入してから結果が得られるまでかなり待っていただくような状況になっています。

野村 TSUBAME 4.0のページで利用率を公開しているんですが、空いているところはグラフの緑のところだけなんですよね(図7)。もちろんできるだけ待たせないよう工夫は行っていて、例えばノードのリソースを分割して、CPUは使うけどもGPUは使わない、といったようにジョブの特性に応じてリソースを指定できるようにはしています。

図7 図7 TSUBAME 4.0のノードの稼働状況。青と赤はランニングノード、ピンクはウェイティングノードで、緑がアイドルノードを示す[クリックで拡大] 出所:TSUBAME 4.0「モニタリング情報」ページ

遠藤 利用率のグラフは待ち行列の専門家が見たら叫びたくなるレベルだと思うんですよ。私が研究してきた並列コンピューティングという観点では時分割を採用するというのが一つの方法ですが、時分割にすると並列シミュレーションの性能はがた落ちしてしまうので、TSUBAME 4.0では難しいかなと。

――それだけTSUBAME 4.0が頼りにされているということなんでしょうね。

遠藤 TSUBAMEは“みんなのスパコン”というキャッチフレーズで有名ですが、両輪として「先進的技術で日本を前に進める」ことも目的にしてきました。TSUBAME 1.0と1.1では旧ClearSpeed Technologyのベクトルプロセッサを、TSUBAME 1.2以降ではNVIDIAのGPUを全面的に採用し、x86 CPUがみんなのスパコンの部分を受け持ちつつ、こうしたアクセラレータが先進的技術を受け持ってきて、TOP500やGreen500といったベンチマークを含めて成果を出してきました。

 ただしNVIDIAのGPUは現在ではコモディティになっていますので、将来のTSUBAMEにおいて、“みんなのスパコン”と両輪となるコンセプトを何にするかがTSUBAME 5.0以降での悩みではあるかなと思っています。

東工大 学術国際情報センターの野村哲弘氏(左)と遠藤敏夫氏(右) TSUBAME 4.0の設計、構築、運用で主導的な役割を果たしてきた東工大 学術国際情報センターの野村哲弘氏(左)と遠藤敏夫氏(右)[クリックで拡大](撮影・関 行宏)

――今日はいろいろと興味深いお話を聞かせていただきました。TSUBAME 4.0によって将来の研究や開発がさらに発展していくことを願っています。お忙しいところありがとうございました。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.