「ここ左?」「まだ直進です」とナビが即答、音声エージェントへの呼びかけは不要に:車載情報機器(2/2 ページ)
三菱電機は2019年1月22日、東京都内で記者説明会を開き、同社の情報技術総合研究所が手掛ける車載セキュリティやHMI(ヒューマンマシンインタフェース)の技術を発表した。車載セキュリティの新技術はウイルスの種類ではなく侵入の手口に着目して攻撃を検知する点が特徴だ。HMIは、視線の向きに合わせて的確に警告を発し、音声認識機能の煩わしさを低減する。いずれの技術も、クラウドと連携せず、組み込みで効果を発揮する点を強みとする。
呼びかけやボタン操作なし、すぐに返事してくれる
今回発表したHMI技術は、ドライバーモニタリングシステムを活用し、“気の利いた注意喚起”や人と話すようなルート案内を実現する。
開発の背景には、センサーによる障害物の警告や既存の音声認識技術に対する煩わしさがある。自動車メーカーの意見や要望、社内のバリューエンジニアリングの取り組みで挙がってきた課題を踏まえて、今回のHMI技術を開発した。視線の向きや口の動きなどをセンシングするドライバーモニタリングシステムや音声認識機能には、三菱電機のAI(人工知能)技術「Maisart」を活用している。
“気の利いた注意喚起”は、自車に接近している周囲の歩行者や車両の全てに対して警告音を鳴らすのではなく、ドライバーが注視していない方向の障害物に対して特に注意を促すというコンセプトだ。ドライバーの注視している方向はドライバーモニタリングシステムで検知。接近してくる歩行者や車両は、車両のフロントに搭載したカメラで認識し、映像を車内のディスプレイに表示する。
人と話すようなルート案内では、「次で右に曲がるの?」「どの角で左折?」といったドライバーの発話を認識して音声でルートを示す。クラウドではなく車載情報機器でドライバーの音声を処理することにより、高い応答性を確保している。これにより、ドライバーの質問に対して会話のような応答時間の短さで「3つ以上先の交差点を右折です」「この交差点を左折です」と返答する。音声認識エンジンは既に学習済みのもので、ルート案内に特化した形で調整した。
三菱電機の技術者は、「応答するまでの処理時間は200ms以内を目標にしている。これはかなり速いとみている。返答が返ってくるまでの時間が1秒までであれば人間は自然な会話と同じように感じることができる。クラウド連携ではそれ以上の処理時間が必要になる」と説明。また、三菱電機 情報技術総合研究所 知識情報処理技術部 部長の虻川雅浩氏は、「発話ボタンを押したり、トリガーワードを呼びかけたりしていると時間がかかり、ルートをすぐに確認したい時など必要なタイミングで音声認識機能から回答を得られない」と短い応答時間の重要性を語った。
今回発表したHMI技術では、車載情報機器の従来の音声認識機能とは異なり、発話ボタンの操作やトリガーとなるキーワードの発話を必要としない。ドライバーが発した音声で、ナビゲーションに関する内容を検出した場合に応答する。この時、ドライバーモニタリングシステムでドライバーの口の動きを検知するとともに、アレーマイクで音源の方向を推定することでドライバーの声だけを認識する。また、音声処理エンジンによって、車内の音楽や走行ノイズを除去する。
記者説明会でのデモンストレーションはどの交差点で曲がるかという音声入力で行われたが、その他の車載情報機器の操作にも、トリガーとなるキーワードや発話ボタンを必要としない音声認識機能を展開していく。しかし、トリガーなしの音声認識機能を追求していくと、ただの日常会話と、車載情報機器が動作すべき場面の区別が難しくなる。
これに対し、虻川氏は「クルマの中はリビングなどと比べて誰がどんなタイミングで発話したかをセンシングしやすい条件がそろっているので、音声認識機能の高度化の中でうまく利用できると考えている」と述べた。また、同社の技術者も「日常会話と認識すべき発話の区別が課題になることは認識しており、詳細は言えないが解決策も準備している」と説明した。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 音声認識に視線や感情、眠気検知を組み合わせ、より柔軟なエージェントに
Nuance Communications(ニュアンス)は、消費者向けエレクトロニクス展示会「CES 2019」(2019年1月8〜11日、米国ネバダ州ラスベガス)において、カメラによる視線検知と音声認識技術を組み合わせた開発中の新機能を披露した。開発技術は、POI(Point of Interest)検索やストリーミングサービス、リアルタイムな情報を得る場合にはクラウド連携が必要だが、それ以外については車載情報機器側で処理が終えられるという。 - クルマの操作に関する音声認識は自前で、だからこそ「ハーイ、メルセデス」
メルセデス・ベンツ日本は2018年10月18日、東京都内で会見を開き、コンパクトカー「Aクラス」の新モデルを発表した。音声認識機能を充実させた新開発のインフォテインメントシステム「MBUX(メルセデスベンツユーザーエクスペリエンス)」を初めて採用したモデルとなる。 - トヨタのカーナビからLINEを送れる、オープンソースのSDL対応カーナビを日本投入
トヨタ自動車とLINEは2018年10月15日、千葉市内で記者説明会を開き、LINEの各種サービスに対応したディーラー装着用車載情報機器(カーナビ)を同年12月から日本で発売すると発表した。ライン装着用では2019年夏以降、一部改良などの機会にさまざまな車種でSDL対応カーナビを設定する。 - 「あそこで曲がって」、乗員の指示に従って走る自動運転車
アイシン精機と名古屋大学、徳島大学は2018年10月25日、音声や視線、ジェスチャーで操作する自動運転車を開発したと発表した。 - 「完璧に守る」よりも車載セキュリティに必要なこと、攻撃へのリアルタイムな対応
Continental(コンチネンタル)は、グループ会社であるソフトウェアベンダーのElektrobit(エレクトロビット)や、サイバーセキュリティ企業のARGUS CYBER SECURITY(アーガス)と協力し、コネクテッドカーにエンドツーエンドのセキュリティを提供する。 - 結合テスト段階でECUの脆弱性を早期発見、実際にサイバー攻撃を受けさせる
アズジェントは2018年10月11日、ECU(電子制御ユニット)の脆弱性を早期発見するためのサービス「ThreatHive」を2019年第1四半期から提供を開始すると発表した。