グリッドは2022年7月28日、AIの学習手法であるアンサンブル学習と深層強化学習を組み合わせることで、不確実性の高い環境下で、従来手法より最適な判断が下せるAIの開発に成功したと発表した。同研究成果は、米国物理学協会の学術誌「Jornal of Renewable and Suitainable Energy」にも掲載された。
グリッドは2022年7月28日、AI(人工知能)の学習手法であるアンサンブル学習と深層強化学習を組み合わせることで、不確実性の高い環境下で、従来手法より最適な判断が下せるAIの開発に成功したと発表した。同研究成果は、米国物理学協会の学術誌「Jornal of Renewable and Suitainable Energy」にも掲載された。
近年、特定の制約条件下において最も良いと考えられる解を求める、最適化問題へのAI適用研究が進んでいる。今回の研究でグリッドは、最適化問題の中でも、制約条件が変化し得る不確実性の高い環境下で、最適な解を求めるという問題に取り組んだ。
解決に向けてグリッドが注目したのが、アンサンブル学習と深層強化学習の組み合わせである。アンサンブル学習は特定の問題に対して個々に学習した複数のモデルの判断を集約し、多数決の形式で最終的な判断を決定するという方式である。
単一のデータモデルで学習したAIモデルは高精度の判断が行えるものの、状況が変化してしまうと、判断の質が低下するといった問題がある。一方でアンサンブル学習のモデルは低精度ではあるものの、判断の質が適度にばらける点が特徴だ。このため、複数モデルによる多数決システムを用いることで、ある程度状況が変化しても柔軟かつ高精度な判断が可能になる。
今回の研究では、複数の学習モデルを作成するに当たって深層強化学習を活用した。単一のデータセットを複数に分割して、それぞれ異なるデータをモデルに与え、深層強化学習を行う。こうして作成したモデルは特定の環境下において最適な判断を下し得るが、その他の環境下では最適な判断が下せるとは限らない。これらのモデルの判断をアンサンブル学習の方式で集約し、最終的に判断する仕組みを作成した。グリッド 代表取締役の曽我部完氏は「各モデルが出した知恵を寄せ集めるイメージだ」と語る。
こうした仕組みを発想した理由について、曽我部氏は「人間が将来を予測する際の『曖昧さ』に注目した」と語る。人間は将来を予測する際に、現実のさまざまな要素を厳密に吟味しているわけではない。過去の経験や人の意見を参考に、総合的に判断を下す。こうした仕組みを参考にすることで、不確実性の高い環境下での判断に役立つのではないかと考えたという。
「当社は電力などインフラに関するさまざまな最適化問題を扱っているが、予測は必ず当たるものではない、ということを日々感じている。予測モデルを最適化しても、結局はデータにオーバーフィットした局所解を導けるにすぎない、ということになる。今回の手法を用いることで、総合的に最適な判断を下せるAIを作れるのではないかと考えた」(曽我部氏)
Copyright © ITmedia, Inc. All Rights Reserved.