試行錯誤して円形迷路を解くロボット、人間によるプログラミングは不要に人工知能ニュース

三菱電機は、制御プログラムの開発なしに機器の制御を実現する「モデルベースAI」を開発した。

» 2018年02月16日 14時00分 公開
[齊藤由希MONOist]
傾けてボールを真ん中にうまく誘導する円形迷路をロボットに解かせるには(クリックして拡大)

 30分間の試行錯誤で人工知能(AI)が迷路を解く――。三菱電機は、制御プログラムの開発なしに機器の制御を実現する「モデルベースAI」を開発した。研究開発成果披露会(2018年2月14日)では、傾けながらボールを中央に誘導して遊ぶ円形迷路を用いてモデルベースAIの学習の成果を披露した。

 一般的な制御機器の開発では、制御プログラムを人間がプログラミングして開発することが多い。これに対してモデルベースAIは、制御モデルの構築の自動化と、機械学習の1つである強化学習の組み合わせにより、プログラミングを行わずに最適な制御プログラムを開発できる。

 今回の研究開発成果では、2軸の制御機器により、適切に迷路を傾けてボールを中央に導く制御プログラムを、モデルベースAIによって開発することに成功したという。ただし、3軸以上の多軸制御の場合には、学習内容が大幅に増えるため、学習時間が長くかかってしまう。今後は、制御モデル構築の効率を高めて学習時間を短縮していく考えだ。

 モデルベースAIは、三菱電機が社内のAI技術をとりまとめて多方面に展開するブランド「Maisart(マイサート)」の1つで、試行錯誤を繰り返しながら機器の制御モデルをシステム内部に構築し、あらかじめ設定した目標の達成に必要な制御方法を強化学習によって習得する。

モデルベースAIによる学習のイメージ(クリックして拡大) 出典:三菱電機

 円形迷路を解いた制御機器は、ボールを中央に誘導することを目標として設定。迷路を真上から撮影するカメラによってボールと迷路中央の距離を把握しながら適切に迷路を傾けた。迷路の形状そのものについては学習していない。

 デモンストレーションで用いた制御機器は、オフラインのPCで30分間学習を行った。学習にあたって高性能なコンピュータは必須ではないという。また、実用化後はロボットなど実機を動かして学習させるため、制御モデルの構築にかかる時間を抑制することを重視した。従来、機器の制御を設定するには、対象の機器を理解した熟練者によるプログラム開発が必要だった。そのため、システム開発に時間やコストが掛かることが課題となっていた。

学習済みの2軸制御機器が迷路を解く様子(クリックして拡大)

 三菱電機はこれまで産業用ロボット向けに、対象物の状況の変化を瞬時に把握してリアルタイムに対応できるようにする「器用に制御できるAI」や、ロボットの力覚制御にAI技術を用いてロボットのアームを人の腕のように柔らかく動作させるなどを発表。AI技術の活用により、熟練者によるプログラミングに依存せず、生産ラインに柔軟に対応できることを目指していく。

Copyright © ITmedia, Inc. All Rights Reserved.