検索
連載

ハイブリッドスパコン「地球シミュレータ」は第5世代へ――JAMSTECの上原氏と松岡氏に聞くAIとの融合で進化するスパコンの現在地(8)(4/4 ページ)

急速に進化するAI技術との融合により変わりつつあるスーパーコンピュータの現在地を、大学などの公的機関を中心とした最先端のシステムから探る本連載。第8回は、JAMSTECで「地球シミュレータ」のシステム構築や運用を担当している上原均氏と、生成AI活用を含めデータサイエンスの研究を担当している松岡大祐氏に話を聞いた。

Share
Tweet
LINE
Hatena
前のページへ |       

温暖化のリスクや対策を支援する生成AIを研究中

――(ここで地球シミュレータのユーザーである松岡氏がインタビューに合流)次にAIの活用についてお伺いします。JAMSTECではどのような取り組みを進めているのでしょうか。

JAMSTECの松岡大祐氏
JAMSTEC 付加価値情報創生部門 地球情報科学技術センター データサイエンス研究グループ グループリーダー 上席研究員 博士(工学)の松岡大祐氏[クリックで拡大]

松岡氏 地球科学の研究にAIを使い始めたのは2016年ごろで、シミュレーションデータや観測データの解析に利用してきました。台風や豪雨などの極端現象の検出や予測、リモートセンシング画像からの汚染状況推定などが一例です。2023年ごろからは生成AIの活用にも取り組んでいます。初期値をずらしたシミュレーションをたくさん実行して天気を確率的に予測する「アンサンブル(集団)予報」において、アンサンブルをたくさん作ろうと思うと多くのシミュレーションを実行しなければなりませんので、生成AIを組み合わせて実行効率の向上を図ることが狙いです。

 最近の取り組みの一つが気候サービス向けLLM(大規模言語モデル)の開発です。民間企業では温暖化で想定されるリスクと戦略を報告書として公表することが推奨されていますし、自治体でも災害対策や農林水産業における政策などを策定していかなければなりません。そこで、LLMに指示や質問を与えると、リスク評価や防災対策に役立つさまざまな情報やアドバイスを回答してくれる生成AIサービスがあれば企業や自治体の担当者の負担を大きく減らせるのではないか、と考えて研究を進めています。

――そのLLMについてもう少し詳しく教えてください。

松岡氏 「ChatGPT」などの生成AIサービスに使われているLLMは気候変動に関して一般的な情報しかもっていません。そこで、Metaの「Llama」をベースに東京科学大学(旧・東京工業大学)が日本語を追加学習させた「Llama 3 Swallow」に、ファインチューニングやRAG(検索拡張生成)などの手法を使い、専門家レベルの知識の獲得や地球シミュレータが蓄積してきた気候データへのアクセスを実現したのがこのLLMです(連載第7回の図11)。いずれは気候サービスとして実用化するとともに、気候データを解析するときに、ここに注目すべき、といったお薦めも出力してくれる機能を追加していきたいと考えています。

 ES4ではVE搭載ノードとGPU搭載ノードが同じインターコネクトで接続されていますので、VE搭載ノードで実行したシミュレーションデータを、システムをまたぐことなくGPU搭載ノードに与えて学習させることも可能であり、研究者としてはとても助かっています。

上原氏 ES4のGPU搭載ノードにはノード当たり4TBのメモリを積んでいて、他のGPUクラスタに比べてもかなり大きいのではないかと思っています。シミュレーション結果をストレージから都度読むのではなくメモリに読み込ませておいて高速に学習させたい、といった研究側のニーズに沿ってこのようなスペックを採用しました。

第5世代のES5に向けた検討に着手

――ES4が稼働したのが2021年3月ですから、そろそろ第5世代の「ES5」の議論が始まっているのではないかと思います。お話しいただける範囲で教えてください。

上原氏 いろいろなベンダーから、どれぐらいのタイミングで、こういった製品を、このぐらいの価格で出していく、といった情報はもちろん収集しています。JAMSTECにおけるスパコンの調達は政府の調達手続きに準ずる形で進めており、現在、ユーザーとなる研究者たちと要求内容の検討をしています。

――ES5でもベクトル型を踏襲していくことになるのでしょうか?

上原氏 ベクトル型うんぬんというより、地球科学研究に適したハードをベンダーが提供してくれるかどうかが重要で、われわれとしては各社に頑張って欲しいなという気持ちがあります。ちなみに2024年11月に、スペインのシリコン設計会社であるOpenchipが、世界トップクラスのスパコンを保有するバルセロナ・スーパーコンピューティング・センター(BSC)と、ベクトルプロセッサのノウハウを持つNECと共同で、オープンなRISC-Vをベースにしたベクトルコンピューティングアクセラレータを共同で開発すると発表しました※3)。そういったこともあり、世界的な流れとしてベクトル型がなくなってしまう可能性は低いのではないかと考えています。

※3)Openchipのニュースリリース

 もう一つ重要なのが研究やデータの連続性です。日本はUNEP(国連環境計画)とWMO(世界気象機関)によって組織されたIPCC(Intergovernmental Panel on Climate Change、気候変動政府間パネル)にデータを提供していて、地球シミュレータは初代のESから現行のES4に至るまで継続してその取り組みに大きく貢献しています。仮にアーキテクチャをガラッと変えるとなるとソフトウェアも変わりますから、過去のデータとの間で食い違いが生じないようにしないといけません。こうした研究の連続性にはとても神経を使う必要があり、その点もES5を考える上での課題の一つです。

 どのアーキテクチャを選ぶにしても研究に役立つシステムであることが最も重要ですので、研究者のニーズを最優先に考えて判断したいと考えています。

――最後に読者に一言お願いします。

上原氏 まず地球シミュレータは今も健在ということを申し上げたいと思います。さまざまな研究機関や企業にも使っていただいていますし、例えば今のES4で採用しているインテルアーキテクチャ互換のCPUノードは普通のLinuxサーバですから、何のハードルもありません。こうした記事をきっかけに興味を持っていただければうれしく思います。

――ありがとうございました。

参考文献

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る