「ここ左?」「まだ直進です」とナビが即答、音声エージェントへの呼びかけは不要に車載情報機器(2/2 ページ)

» 2019年01月23日 06時00分 公開
[齊藤由希MONOist]
前のページへ 1|2       

呼びかけやボタン操作なし、すぐに返事してくれる

三菱電機の虻川雅浩氏(クリックして拡大)

 今回発表したHMI技術は、ドライバーモニタリングシステムを活用し、“気の利いた注意喚起”や人と話すようなルート案内を実現する。

 開発の背景には、センサーによる障害物の警告や既存の音声認識技術に対する煩わしさがある。自動車メーカーの意見や要望、社内のバリューエンジニアリングの取り組みで挙がってきた課題を踏まえて、今回のHMI技術を開発した。視線の向きや口の動きなどをセンシングするドライバーモニタリングシステムや音声認識機能には、三菱電機のAI(人工知能)技術「Maisart」を活用している。

発表したHMI技術のデモの様子。右側のディスプレイには歩行者が映っているが、ドライバーはその方向を見ていない。そのため右側を見るように注意を促している(クリックして拡大)

 “気の利いた注意喚起”は、自車に接近している周囲の歩行者や車両の全てに対して警告音を鳴らすのではなく、ドライバーが注視していない方向の障害物に対して特に注意を促すというコンセプトだ。ドライバーの注視している方向はドライバーモニタリングシステムで検知。接近してくる歩行者や車両は、車両のフロントに搭載したカメラで認識し、映像を車内のディスプレイに表示する。

 人と話すようなルート案内では、「次で右に曲がるの?」「どの角で左折?」といったドライバーの発話を認識して音声でルートを示す。クラウドではなく車載情報機器でドライバーの音声を処理することにより、高い応答性を確保している。これにより、ドライバーの質問に対して会話のような応答時間の短さで「3つ以上先の交差点を右折です」「この交差点を左折です」と返答する。音声認識エンジンは既に学習済みのもので、ルート案内に特化した形で調整した。

 三菱電機の技術者は、「応答するまでの処理時間は200ms以内を目標にしている。これはかなり速いとみている。返答が返ってくるまでの時間が1秒までであれば人間は自然な会話と同じように感じることができる。クラウド連携ではそれ以上の処理時間が必要になる」と説明。また、三菱電機 情報技術総合研究所 知識情報処理技術部 部長の虻川雅浩氏は、「発話ボタンを押したり、トリガーワードを呼びかけたりしていると時間がかかり、ルートをすぐに確認したい時など必要なタイミングで音声認識機能から回答を得られない」と短い応答時間の重要性を語った。

 今回発表したHMI技術では、車載情報機器の従来の音声認識機能とは異なり、発話ボタンの操作やトリガーとなるキーワードの発話を必要としない。ドライバーが発した音声で、ナビゲーションに関する内容を検出した場合に応答する。この時、ドライバーモニタリングシステムでドライバーの口の動きを検知するとともに、アレーマイクで音源の方向を推定することでドライバーの声だけを認識する。また、音声処理エンジンによって、車内の音楽や走行ノイズを除去する。

トリガーワードや発話ボタンの操作を省略しながらドライバーの発話を検出する仕組み(クリックして拡大) 出典:三菱電機

 記者説明会でのデモンストレーションはどの交差点で曲がるかという音声入力で行われたが、その他の車載情報機器の操作にも、トリガーとなるキーワードや発話ボタンを必要としない音声認識機能を展開していく。しかし、トリガーなしの音声認識機能を追求していくと、ただの日常会話と、車載情報機器が動作すべき場面の区別が難しくなる。

 これに対し、虻川氏は「クルマの中はリビングなどと比べて誰がどんなタイミングで発話したかをセンシングしやすい条件がそろっているので、音声認識機能の高度化の中でうまく利用できると考えている」と述べた。また、同社の技術者も「日常会話と認識すべき発話の区別が課題になることは認識しており、詳細は言えないが解決策も準備している」と説明した。

「気が利く自然なHMI技術」の概要(クリックで再生)
前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.