自動並列化深層学習ミドルウェアを開発、オープンソースとして公開:人工知能ニュース
情報通信研究機構と東京大学は、自動並列化深層学習ミドルウェア「RaNNC」を開発し、オープンソースとして公開を開始した。「GitHub」にソースコードを公開しており、商用目的を含めて無償で利用できる。
情報通信研究機構(NICT)は2021年3月31日、東京大学と共同開発した自動並列化深層学習ミドルウェア「RaNNC(Rapid Neural Net Connector)」をオープンソースとして公開を開始した。ソフトウェア開発のプラットフォーム「GitHub」でソースコードを公開しており、商用目的を含めて無償で利用できる。
RaNNCは、深層学習ソフトウェア「PyTorch」用に記述した既存のニューラルネットワーク定義を入力すると、実行速度を最適化しながら、各GPUのメモリに収まるように自動的にニューラルネットワークを分割して、データ並列とモデル並列とのハイブリッドにより複数のGPUを用いて並列に学習する。
従来の大規模ニューラルネットワークの学習では、ニューラルネットワークを分割する際、複雑なニューラルネットワーク定義を大幅に書き換えなければならず、高度な知識や作業コストが必要とされていた。RaNNCでは、定義を書き換える必要がないため、大規模ニューラルネットワークの学習が容易となる。
また、既存のソフトウェア「Megatron-LM」「Mesh-TensorFlow」は、BERTなど特定のニューラルネットワークにしか使用できなかったが、RaNNCは適用可能なニューラルネットワークの種類に制限がない。
NICTの計算機環境で比較実験を実施したところ、RaNNCはMegatron-LMの約5倍の規模のニューラルネットワークを学習できた。同じ規模のニューラルネットワークでは、ほぼ同等の学習速度となっている。
NICTデータ駆動知能システム研究センターでは、大規模Web情報分析システム「WISDOM X」や高齢者介護用マルチモーダル音声対話システム「MICSUS」、次世代音声対話システム「WEKDA」などさまざまなシステムを開発している。今後はこれらのシステムにRaNNCを用いることで、さらなる性能向上が期待できる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AIと機械学習とディープラーニングは何が違うのか
技術開発の進展により加速度的に進化しているAI(人工知能)。このAIという言葉とともに語られているのが、機械学習やディープラーニングだ。AIと機械学習、そしてディープラーニングの違いとは何なのか。 - 機械学習はどうやって使うのか――意外と地道な積み重ね
前編では、AI(人工知能)と機械学習、ディープラーニングといった用語の説明から、AIを実現する技術の1つである機械学習が製造業を中心とした産業界にも徐々に使われ始めている話をした。後編では、機械学習を使ったデータ分析と予測モデル作成について説明する。 - 機械学習で入ってはいけないデータが混入する「リーケージ」とその対策
製造業が機械学習で間違いやすいポイントと、その回避の仕方、データ解釈の方法のコツなどについて、広く知見を共有することを目指す本連載。第1回では「リーケージ」について取り上げる。 - 機械学習による逆問題への対処法、材料配合や工程条件を最適化せよ
製造業が機械学習で間違いやすいポイントと、その回避の仕方、データ解釈の方法のコツなどについて、広く知見を共有することを目指す本連載。第2回は、製造業で求められる材料配合や工程条件の予測に必要な、機械学習による逆問題への対処法ついて取り上げる。 - 教師データが足りないと「異常予測」は難しい、ならば「異常検知」から始めよう
製造業が機械学習で間違いやすいポイントと、その回避の仕方、データ解釈の方法のコツなどについて、広く知見を共有することを目指す本連載。第3回は、「異常予測」と「異常検知」について取り上げる。教師データ量の不足が課題になる「異常予測」に対して、「異常検知」は教師データなしでも始められることが特徴だ。 - 偽相関の罠に陥らない、製造業における機械学習を用いた要因分析のコツ
製造業が機械学習で間違いやすいポイントと、その回避の仕方、データ解釈の方法のコツなどについて、広く知見を共有することを目指す本連載。第4回は、製品不良や設備故障などの要因分析に機械学習を適用する際に留意するべきことなどを紹介します。