BMW純正の音声入力機能、スマートフォンの音声エージェントと何が違う?車載情報機器

今後の音声入力機能はどのような処理が主流になるのか。「新車装着用の音声入力は組み込みとクラウドの併用だ」とNuance Communicationsは見込んでいる。

» 2017年04月18日 06時00分 公開
[齊藤由希MONOist]
音声入力機能は普及が進み、新車装着用から市販製品まで選択肢が広がっている 音声入力機能は普及が進み、新車装着用から市販製品まで選択肢が広がっている(クリックして拡大)

 車載情報機器の音声入力機能は珍しいものではなくなった。カーナビゲーションシステムメーカーの市販製品や、新車装着用の車載情報機器の多くが音声入力に対応している。スマートフォンの音声認識機能を車載情報機器でそのまま使えるようにした、Apple「CarPlay」やGoogle「Android Auto」もある。

 かつては組み込みで音声を処理するため特定の用語しか認識しないコマンド入力型だったが、携帯電話機の通信回線や車載通信機を利用してドライバーの音声をクラウドで処理することにより、自然な発話や略称なども認識できるよう進化している。

 今後の音声入力機能はどのような処理が主流になるのか。「自動車メーカーの新車装着用の音声入力は組み込みとクラウドの併用になっていく」と音声認識システム開発の大手であるNuance Communications(以下、ニュアンス)は見込んでいる。

ハイブリッドな音声入力

540iでBMWの新車装着用の音声入力を体験 540iでBMWの新車装着用の音声入力を体験(クリックして拡大)

 クラウドと組み込みの“ハイブリッド”で音声を処理するニュアンスのコネクテッドカー向けプラットフォーム「Dragon Drive」は、BMWの「5シリーズ」や「7シリーズ」に採用されている。ニュアンスはアプリケーションの設計やコーディング、実装の一部に協力した。

 540iを借りて、都内を走りながら新車装着用の音声入力機能を体験した。マイクは運転席と助手席のサンバイザー付近に設置されている。音声入力機能は、ステアリングのスイッチを押すと起動する。

助手席のマイクを活用して認識精度を向上している 助手席のマイクを活用して認識精度を向上している(クリックして拡大)

 助手席のマイクには2つの役割がある。運転中に電話がかかってきた場合に、ドライバーだけでなく助手席の乗員も通話に参加できるようにするのが1つ。2つ目の役割は、音声操作中に助手席の乗員が発した声を除去してドライバーの声のみを処理することにより、認識精度を向上するというものだ。

 「音声操作中に助手席のマイクをオフにするだけでは、運転席側のマイクが助手席からの声を拾ってしまいノイズになる。そのため、助手席の声が不要な時もマイクをオンにして処理に活用している」(ニュアンス コミュニケーションズ ジャパンでオートモーティブ プリンシパル マーケティングマネージャーを務める村上久幸氏)

クラウド処理を待たずに組み込みで判断

音声入力はタイヤ空気圧のチェックにも対応。車両と連携した新車装着用の車載情報機器ならではの機能だ 音声入力はタイヤ空気圧のチェックにも対応。車両と連携した新車装着用の車載情報機器ならではの機能だ(クリックして拡大)

 ハイブリッド処理の特徴は、発話後の処理時間の短さと、割り込み機能だ。

 ハイブリッド処理ではクラウドと組み込みで同時に音声を処理する。例えば、ラジオの放送局の名称や周波数、車載情報機器に保存されている楽曲やアーティスト名などの固有名詞で、組み込みの処理で一定の確度が得られれば、クラウド処理の結果を待たずにドライバーの要求した操作(ラジオの選局、楽曲の再生など)を行う。「スタバに行きたい」といった略称を用いた検索や、「お腹が空いた」といった曖昧な発話にはクラウドで処理する自然言語理解を活用する。

 割り込み機能はメッセージの作成で役に立つ。メッセージの作成は次のようにドライバーとシステムが交互に発話して進む。

ドライバー 「ショートメッセージを作成」

システム 「誰にメッセージを送りますか」

ドライバー 「○○さん(スマートフォンに登録している連絡先をいう)」

システム 「メッセージをどうぞ」

ドライバー 「(メッセージ本文を発話)」

システム 「このメッセージを送信しますか? 送信する場合は送信、送信しない場合はキャンセルとってください」

ドライバー 「送信」

音声入力で作成したメッセージの例 音声入力で作成したメッセージの例(クリックして拡大)

 割り込み機能は、こうした手順の中で、システムの指示が終わるのを待たずにドライバーが発話しても認識できるようにしたものだ。システムの指示を最後まで聞くストレスを与えないことで、クラウド処理のみの音声認識システムよりも満足度を高める。「クラウド型と組み込み型を併用するハイブリッド処理によって、ストレスの少ない新車装着用の機能が実現できる」(村上氏)。

曖昧な要望に、AIで的確に応える

 音声入力機能の進化に向けて、ニュアンスが次の開発テーマとするのは、AI(人工知能)技術を使った利便性向上だ。

 現在のBMWの音声入力機能では、ドライバーが「お腹が空いた」というと近隣の飲食店を目的地の候補として提案するが、ドライバーの好みは反映されない。これに対し、過去に設定した目的地などをAIが学習し、好みの飲食店や頻繁に利用する系列のガソリンスタンドを提示するといったパーソナライゼーションを目指している。

 村上氏は「音声認識の精度は既に高い水準にあり、これからは小さな改善の積み重ねになっていく。高精度な認識結果をうまく活用していくことで、より便利な音声認識システムを提供したい」と述べた。

Copyright © ITmedia, Inc. All Rights Reserved.