こうした従来型のプロセッサ設計の「工夫」に対して、PFNは「消費電力のうち、演算回路が使った電力量の割合」と「チップ面積のうち、演算回路が使った部分の割合」をともに最大化するようなプロセッサの開発を目指した。「これらの割合が1に近い値であればあるほど、理想的なプロセッサ設計であると考える。その結果生まれたのがMN-Coreだ」(牧野氏)。
各MABが適切なタイミングでデータと命令の受け渡しと回収を順次行う仕組みを作ることで、プロセッサ全体で効率よい計算処理を実行するようにした。また、このプロセッサをMN-Coreに搭載した上で、MN-Coreの設定やHPL処理用ソフトウェアの最適化処理を行えば、計算効率性のさらなる向上が見込めるという。
具体的には、通常のHPL処理用ソフトウェアでは「データを待つ」「計算する」「(次のノードへの)通信を行う」という一連の計算処理を行う。当然だが次のノードは前のノードからデータを通信で受け取るまで計算プロセスへは進めない。一方で内部ルーティンの分割最適化や実行スケジュールの最適化といった処理を施すことで、計算が終了した箇所から次のノードへとデータを逐次送れる。これによって、計算効率は「単純計算で約3倍」(PFN)に向上するという。
PFN 執行役員 計算基盤担当VPである土井裕介氏は「2020年6月時点でのGreen500ではMN-Coreの動作がしっかり行えるようにすることを優先したため、正直に言えば最適化余地を多く残したままベンチマークを測定することになってしまった。一方で同年11月に発表したGreen500では、最適化処理をしっかりと行った結果、計算効率は10ポイント以上改善し、電力効率も20%以上改善して26.04 Gflops/Wを達成した。なお、MN-3は『ZONE 0』と『ZONE 1』と呼ばれる計算機クラスタが存在するが、今回の性能測定時にはZONE 0のみを稼働させて計測した」と説明した。
土井氏は今後のMN-Coreの開発展望について「2020年11月のGreen500では、MN-Coreが単に高い理論値性能を持つだけでなく、ソフトウェアを活用することでしっかりと高いパフォーマンスが出せると分かった。計算実行スケジュールをしっかり組んで最適化できなければ、ソフトウェアの計算効率はかえって低下してしまうが、こうした問題をクリアした。一方で、当社はHPL処理に特化したソフトウェアだけを開発したいというわけではない。今回開発した最適化手法を、現在開発している深層学習ソフトウェアスタックへと移植することを目指したい」と語った。
Copyright © ITmedia, Inc. All Rights Reserved.