BMW純正の音声入力機能、スマートフォンの音声エージェントと何が違う?:車載情報機器
今後の音声入力機能はどのような処理が主流になるのか。「新車装着用の音声入力は組み込みとクラウドの併用だ」とNuance Communicationsは見込んでいる。
車載情報機器の音声入力機能は珍しいものではなくなった。カーナビゲーションシステムメーカーの市販製品や、新車装着用の車載情報機器の多くが音声入力に対応している。スマートフォンの音声認識機能を車載情報機器でそのまま使えるようにした、Apple「CarPlay」やGoogle「Android Auto」もある。
かつては組み込みで音声を処理するため特定の用語しか認識しないコマンド入力型だったが、携帯電話機の通信回線や車載通信機を利用してドライバーの音声をクラウドで処理することにより、自然な発話や略称なども認識できるよう進化している。
今後の音声入力機能はどのような処理が主流になるのか。「自動車メーカーの新車装着用の音声入力は組み込みとクラウドの併用になっていく」と音声認識システム開発の大手であるNuance Communications(以下、ニュアンス)は見込んでいる。
ハイブリッドな音声入力
クラウドと組み込みの“ハイブリッド”で音声を処理するニュアンスのコネクテッドカー向けプラットフォーム「Dragon Drive」は、BMWの「5シリーズ」や「7シリーズ」に採用されている。ニュアンスはアプリケーションの設計やコーディング、実装の一部に協力した。
540iを借りて、都内を走りながら新車装着用の音声入力機能を体験した。マイクは運転席と助手席のサンバイザー付近に設置されている。音声入力機能は、ステアリングのスイッチを押すと起動する。
助手席のマイクには2つの役割がある。運転中に電話がかかってきた場合に、ドライバーだけでなく助手席の乗員も通話に参加できるようにするのが1つ。2つ目の役割は、音声操作中に助手席の乗員が発した声を除去してドライバーの声のみを処理することにより、認識精度を向上するというものだ。
「音声操作中に助手席のマイクをオフにするだけでは、運転席側のマイクが助手席からの声を拾ってしまいノイズになる。そのため、助手席の声が不要な時もマイクをオンにして処理に活用している」(ニュアンス コミュニケーションズ ジャパンでオートモーティブ プリンシパル マーケティングマネージャーを務める村上久幸氏)
クラウド処理を待たずに組み込みで判断
ハイブリッド処理の特徴は、発話後の処理時間の短さと、割り込み機能だ。
ハイブリッド処理ではクラウドと組み込みで同時に音声を処理する。例えば、ラジオの放送局の名称や周波数、車載情報機器に保存されている楽曲やアーティスト名などの固有名詞で、組み込みの処理で一定の確度が得られれば、クラウド処理の結果を待たずにドライバーの要求した操作(ラジオの選局、楽曲の再生など)を行う。「スタバに行きたい」といった略称を用いた検索や、「お腹が空いた」といった曖昧な発話にはクラウドで処理する自然言語理解を活用する。
割り込み機能はメッセージの作成で役に立つ。メッセージの作成は次のようにドライバーとシステムが交互に発話して進む。
ドライバー 「ショートメッセージを作成」
システム 「誰にメッセージを送りますか」
ドライバー 「○○さん(スマートフォンに登録している連絡先をいう)」
システム 「メッセージをどうぞ」
ドライバー 「(メッセージ本文を発話)」
システム 「このメッセージを送信しますか? 送信する場合は送信、送信しない場合はキャンセルとってください」
ドライバー 「送信」
割り込み機能は、こうした手順の中で、システムの指示が終わるのを待たずにドライバーが発話しても認識できるようにしたものだ。システムの指示を最後まで聞くストレスを与えないことで、クラウド処理のみの音声認識システムよりも満足度を高める。「クラウド型と組み込み型を併用するハイブリッド処理によって、ストレスの少ない新車装着用の機能が実現できる」(村上氏)。
曖昧な要望に、AIで的確に応える
音声入力機能の進化に向けて、ニュアンスが次の開発テーマとするのは、AI(人工知能)技術を使った利便性向上だ。
現在のBMWの音声入力機能では、ドライバーが「お腹が空いた」というと近隣の飲食店を目的地の候補として提案するが、ドライバーの好みは反映されない。これに対し、過去に設定した目的地などをAIが学習し、好みの飲食店や頻繁に利用する系列のガソリンスタンドを提示するといったパーソナライゼーションを目指している。
村上氏は「音声認識の精度は既に高い水準にあり、これからは小さな改善の積み重ねになっていく。高精度な認識結果をうまく活用していくことで、より便利な音声認識システムを提供したい」と述べた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- “使えない”クルマの音声認識が“使える”ようになる日は近い
音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。 - CarPlayの「究極のドライビングパートナー」っぷりを試す
アップルが2014年3月のジュネーブモーターショーで「CarPlay」を発表してから2年。ようやく日本でも自動車メーカーがCarPlay対応モデルを市場投入し始めた。アップルはCarPlayを「車の中でiPhoneを使う、より優れた安全な方法」で「究極のドライビングパートナー」だとする。750kmのドライブでCarPlayを試し、“パートナーっぷり”を確かめた。 - スマートフォンの音声アシスタントと雑談したことがある人は20歳代で46%
ニュアンス コミュニケーションズ ジャパンは、日本国内の自動車保有者1100人を対象に実施した音声認識機能の利用調査結果を発表した。車載情報機器の音声認識機能に対する総合的な満足度は向上しているものの、音声認識機能の利用者は自動車保有者の2割弱にとどまることが分かった。 - 運転中の音声入力の認識率を3割向上、運転席からの声だけを拾う
新日本無線は、「オートモーティブワールド2017」において、雑音の多い走行中の車内でも音声認識の精度を向上する技術を紹介した。 - 車載情報機器のスマホ連携基盤にニュアンス参戦、マツダ提携の米ベンチャーと
音声認識エンジンを手掛けるNuance Communications(ニュアンス)と米国ベンチャーで車載情報機器のソフトウェアプラットフォームを展開するOpenCar(オープンカー)が提携。常時通信接続を行うコネクテッドカーで重要な役割を担う、車載情報機器のスマートフォン連携プラットフォームの事業展開を加速させる。