東大生技研の小野謙二氏が取り組むスパコン京を活用した設計システム。2013年には企業が無料で利用できるようになる。
日本産スーパーコンピュータの「京(けい)」は2011年6月発表の「TOP500」リストで第1位を獲得し、さらに同年11月発表の同リストでも第1位をキープした。京は同年6月にLINPACK(リンパック)ベンチマークでは8.16PFLOPS(ペタフロップス)を記録している。
東京大学 生産技術研究所 特任研究員で工学博士の小野謙二氏は、京のような高性能マシンを製造業の設計分野で活用するためのシステム開発プロジェクトに携わる。本稿では、CAEベンダーヴァイナス社の2011年度 ユーザーカンファレンス(2011年10月開催)の同氏特別講演の内容についてお伝えする。
「LINPACKは計算部分のカーネルのベンチマークです。われわれの使うアプリケーションは、それ以外にもいろいろな計算処理を行っています。実際のアプリで本当に性能が出るのかといえば、まだまだ大きな努力をしないといけない状況です。このような超並列計算機は、そこから生み出されるデータはやはり、複数というか、かなり多くのファイルとして出力されます。そうすると、ファイルのハンドリングに非常に労力が掛かってしまう状況でした。つまり大規模計算ならではの問題点が出てきます」(小野氏)。
2013年には、小野氏らが開発する設計システムのβ版が無償で利用可能になる予定だという。モノづくり関係の企業であれば、事業規模の大小は全く関係なく利用できる。申し込みに当たっては、企業はNDAを結んだ上、意見や改善要望などのフィードバックが義務化される。興味がある方は、まずは同研究所の正式発表を待ち、実際に申し込んでみて次世代スパコンによる設計システムの開発に参加してみてはいかがだろうか。
小野氏は、京のアーキテクチャの基本について解説した。
*10PFLOPS/systemは2012年の運用開始時の性能である。
並列計算で問題となる通信については、京では3次元のトーラスネットワークを改良した6次元メッシュ/トーラスネットワークを使っており、隣接間通信が非常に速いという特徴を持つ。「高性能アプリケーションの動作については、現在チューニング段階ですが、『京のシステムは非常によく働いている』という印象」だと、小野氏は述べた。
次に、ソフトウェア開発への要求について小野氏は説明する。そこで並列プログラムの性能を予測するときに指針となる「Amdahl(アムダール)の法則」(高い並列性能を出すには、CPUを増やす以前にアルゴリズムが重要である)の例として、「90%しか並列化されていないプログラムでは、100台のマシンで飽和してしまうことを示した。
トーラスネットワーク:直接結合網の一種。環状に結合されるネットワーク構成である。
小野氏たちは、64万コアで構成される京で動かす実際のアプリケーションについて、99.99〜99.999%の並列化を目指しているということだ。そこで、SIMD(Single Instruction Multiple Data:シムド)の活用が鍵だと述べた。
SIMD:1つの命令で、複数のデータを同時に処理すること、もしくはそのための命令のこと。マルチメディアデータを取り扱うマイクロプロセッサや、DSP、スーパー・コンピュータなどにおいて実装されている(@IT「Insider’s Computer Dictionary」より)。
京では、以下の5分野を中心として成果を出していくという。
東京大学 生産技術研究所の研究は、上記のモノづくり分野に属すると小野氏は述べた。同研究所は、日本原子力研究開発機構、宇宙航空研究開発機構(JAXA)と共同して、産業用アプリケーションの開発・研究を行っている。そこを中核とし、関連の大学・研究機関、メーカー(民間企業)、ソフトウェアベンダーも巻き込んで、プロジェクトを推進しているとのことだ。
「他の戦略分野と違うところは、後ろに実際の企業ユーザーの皆さんがいるということです。それは、非常なプレッシャーになります。やはり産業界の皆さんの要求は非常に厳しいということです」(小野氏)。
同研究所の産業用アプリケーションの開発では、特にメーカーのヒアリングを重視しており、その要求項目としては、主に以下の項目が挙がっているという。
小野氏は上記を実現する仕組みとして、以下の図でシステム構成を示した。
Copyright © ITmedia, Inc. All Rights Reserved.