大日本印刷がAI人材倍増へ、AWSの自律走行レーシングカーで強化学習を学ぶ:人工知能ニュース(1/2 ページ)
AWSジャパンが機械学習の1つである強化学習を自律走行するレーシングカーの開発を通じて学べる「AWS DeepRacer」について説明。国内での発売時期は未定だが、同年6月12〜14日に幕張メッセで開催されるユーザーイベント「AWS Summit Tokyo 2019」などで動作可能な状態で披露する予定である。
アマゾン ウェブ サービス ジャパン(以下、AWSジャパン)は2019年5月23日、東京都内で会見を開き、機械学習の1つである強化学習を自律走行するレーシングカーの開発を通じて学べる「AWS DeepRacer」について説明した。国内での発売時期は未定だが、同年6月12〜14日に幕張メッセで開催されるユーザーイベント「AWS Summit Tokyo 2019」などで動作可能な状態で披露する予定である。
大日本印刷の福田佑一郎氏(左)とAWSジャパンの瀧澤与一氏(右)。福田氏が手に持っているのが「AWS DeepRacer」で、瀧澤氏が持っているのはAWS DeepRacerの外部筐体を外したもの(クリックで拡大)
AWS DeepRacerは、2018年11月に米国で開催された「AWS re:Invent 2019」で初披露された、強化学習を学ぶためのツールでありサービスである。クラウドのAWS上で動作する開発環境「AWS DeepRacerコンソール」と、同開発環境で作成した自律走行のモデルを用いて実世界のレーシングコースを走らせるための18分の1サイズのレーシングカーであるAWS DeepRacerから構成されている。
「AWS DeepRacer」の構成。18分の1サイズのレーシングカー、開発環境の「AWS DeepRacerコンソール」、バーチャルコースと実コースで走行時間を競う「AWS DeepRacer League」から構成される(クリックで拡大) 出典:AWSジャパン
現在のAI技術の進化をけん引する機械学習は、ラベル付きの学習データを用いる教師あり学習、学習データにラベルが不要な教師なし学習、そして強化学習に分けることができる。強化学習は、学習に使用するデータにラベルは不要だが、良い行動に報酬を与える、良くない行動に報酬を与えないといった、特定の行動にインセンティブを与える報酬関数の設定が重要になる。
AWSジャパン 技術統括本部 レディネス&テックソリューション本部 本部長/プリンシパルソリューションアーキテクトの瀧澤与一氏は「強化学習を活用するためには、この報酬関数の扱いを学ぶ必要がある。AWS DeepRacerでは、レーシングカーをなるべく速く自律走行させるという目的の下で、報酬関数をはじめとする強化学習について学ぶことができる」と語る。
開発環境となるAWS DeepRacerコンソールは既に利用可能であり、日本国内でもAWSのIDを持つユーザーであれば、今すぐ試せる状態にある。自身で設定した報酬関数などによってモデルの強化学習を積み重ねた後には、バーチャル空間内のレーシングコースの走行時間を競う「AWS DeepRacer League」にも参加できる。また、このAWS DeepRacer Leagueについては、実機であるAWS DeepRacerにモデルを実装して、AWS Summitなどのユーザーイベントで用意される実コースで走行時間を競うこともできる。
AWS DeepRacerコンソールは、AWSの無料利用枠では最大10時間分のトレーニングが利用可能だ。AWS DeepRacerの販売価格は米国のAmazon.comで399米ドルとなっている。国内販売については技適取得などが必要であり、これらの準備が完了次第販売できる見通しだ。「AWS Summit Tokyo 2019では、技適を取得したものを使って自律走行を試せるようにする」(瀧澤氏)という。
Copyright © ITmedia, Inc. All Rights Reserved.