日立製作所は、人が用意した実績データに頼らず自己競争によって学習するビジネス向けAI技術を開発した。同技術をサプライチェーンビジネスを模したゲームを用いて検証したところ、熟練者の発注時より損失を低減するなど、有効性が確認できた。
日立製作所(日立)は2017年12月25日、人が用意した実績データに頼らず、自己競争によって学習するビジネス向けAI(人工知能)技術を開発したと発表した。
今回開発した技術では、ディープラーニングを用いたAIエージェントで企業を表し、複数のエージェントを相互接続したAI群でビジネスを表現する。各エージェントは、状況を考慮しつつ、互いにモノや情報のやりとりを繰り返し、損失低減などアウトカム(成果)を向上するためにはどのようなアクションが有効かを学習する。
同技術は、相互接続された複数のAIエージェントそれぞれの学習を管理し、各エージェントの学習が悪影響を相互に与えないようにする学習管理機能を備える。各エージェントの学習タイミングを制御し、初期段階では1つのエージェントのみに学習させ、後期には学習するエージェントの数を徐々に増やしていく。これにより、エージェントが同時に学習する際の競合を避け、エージェント同士の協調を学習させることができ、アウトカムの向上につながる。
また、AIエージェントが学習を繰り返すと、各エージェントの学習結果(モデル)に偏りが生じ、AI群のアウトカムが個別最適の状態に陥ってアウトカムの向上が滞ってしまう。そこで、複数生成されたAI群の間で、エージェント同士のモデルのパラメータを掛け合わせることで、新たなモデルを持つAIエージェントを生成し、新たなAI群を構築。複数のAI群のアウトカムを比較して、アウトカムの劣るAI群は消滅させ、優れるAI群を残す処理(自己競争)を繰り返すことで、より良いアウトカムを追求できる。
同社は、この技術の有効性を、サプライチェーン上の複数企業によるビジネスを模擬した「ビールゲーム」で検証した。このゲームでは、小売、卸売、仲卸、工場という4つのエージェントが発注量をそれぞれ決定し、サプライチェーン全体で在庫や欠品などの損失を最小にすることを競う。予測不能な需要変動の影響に加え、発注量を決める際に、在庫や欠品などの情報を共有しないといった難しさがある。
同ゲームにおいて、熟練者が経験に基づいて発注した場合、35週で平均2028ドル(約22万9300円)の損失を出すのに対し、今回のAI技術を用いることで、損失を489ドル(約5万5300円)に低減できることを確認した。
ディープラーニングなどを用いたAIは、大量の実績データを元に学習して予測や判断をするため、大量のデータが入手できない場合、正確な予測や判断が難しくなるという課題がある。このため、不確定要素の多いビジネスの実問題に適用できるかは不明だった。日立は今回の技術により、ビジネスの問題についても自己競争を活用した学習が有効であることを示した。
今後日立では、今回のAI技術のソースコードを同社グループ内で公開する。同技術をサービスや製品に組み込んで、電力やエネルギーの他、産業、流通など、幅広い分野における社会イノベーション事業に活用する。
Copyright © ITmedia, Inc. All Rights Reserved.