音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。
「スマホみたいに上手くいかない。どうして、車載のはダメなんだ」。
車載の音声認識システムに対して、不満を持っているユーザーは多い。
そんなネガティブな印象を持つ時代は、もうすぐ完全に終わる。
音声認識システム開発の大手・Nuance Communications(以下、ニュアンス)が2016年3月7日(米国時間)、米国カリフォルニア州パルアルト市内のホテルで同社の最新技術説明会「Nuance Automotive Innovation Day」を開催した。参加したのは、シリコンバレーにある自動車メーカーやティア1サプライヤの研究開発および情報収集を行う関係者、さらに米国在住のIT関連メディアだ。日本のメディア関係者は筆者1人だった。
これまでニュアンスは、こうした催しをデトロイトやシュトゥットガルト、そして東京で定期的に実施してきた。しかしシリコンバレーでの開催は初めてだ。
その理由は、今回のメイントピックが、シリコンバレーで開発が加速しているIoT(モノのインターネット化)とAI(人工知能)だからだ。
ニュアンスのMobile部門筆頭副社長のBob Schassler氏は「弊社は10年以上、車載器に対応する音声認識技術を提供してきた。だが、IoTが本格化している今、これまでの車載情報機器の領域を越える新たなるビジネスと技術分野に踏み出す」として、新戦略「オートモーティブ・アシスト」を打ち出した。
その中で、車載音声認識システムとしては、車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式を提唱。既に、インターネット常時接続サービスに対応する最新型の「BMW7シリーズ」に搭載されており、同様の技術が今後、各自動車メーカーから量産化される可能性が高い。ちなみにニュアンスは、北米トヨタの車載情報機器プラットフォーム「Entune」、レクサスの「Enform」、General Motors(GM)、Daimler(ダイムラー)のメルセデス・ベンツ、Volkswagen(フォルクスワーゲン)など。主要メーカー向けにこれまで約1億4000万台分の車載音声認識システムを出荷している。
今回は、「ハイブリッド」システムの量産型、およびプロトタイプを搭載したタブレット端末を使い、GMのキャデラックの「エスカレード」とBMW7シリーズを使ったデモンストレーションを行った。
BMW7シリーズでは、地名、住所、カテゴリー別の名詞を対象としたPOI(Point of Interest)検索で、大まかな地域を示す「〇〇通り沿いのスターバックス」や、ホテルやレストランに限定せず大まかに「ミシガン州内〇〇のマリオット」と発話しても、2〜3秒後に的確なPOIリストが表示された。
また、「フリーウェイ101号線の南方向」と発話すると、近隣のフリーウェイの入口を表示した。その他では、ユーザーがPOIの名称を完全に覚えておらず曖昧な表現で発話しても、発音が類似するPOIについての情報が表示された。
テキストメッセージのメール送信は、かなり長いセンテンスでも、音声認識による文字化が正確に行われた。そして、車載器からの音声ガイダンスの途中でこちらから次の発話を行っても、それを音声認識する「バージイン」機能も有効に作動した。
こうした各種の音声認識機能を使う際、ユーザーとしては、レスポンスの速さと情報の正確さの両方を求める。この要求に答えるには、「ハイブリッド」方式における車載器とクラウドの連携バランスが重要になる。レスポンスの速さでは車載器が、情報の正確さではクラウドが優れているが、レスポンスの速さを優先して車載器で音声認識を行うと、情報が不正確になることがあるからだ。
そこで、レスポンスの速さに優れる車載器を優先する場合でも、車載器による音声データ解析の“スコア”がある程度の高さに達した際には、クラウドによるデータ解析結果を待たずにユーザーにレスポンスする設定になっている。
近年、Apple(アップル)の音声認識アシスタント「Siri」に対応するクルマが増えているが、ニュアンスの「ハイブリッド」方式では、同社が得意とする車載器とクラウド経由でのデータ解析のバランスを、自動車メーカーからの仕様要求に応じて改良できることが特徴だ。
この他、BMW7シリーズでは、タイヤ空気圧やエンジンオイルの量など、車両の状況についても、音声認識システムを介してHMI(Human Machine Interface)にデータを表示する。また、オーナーズマニュアルとしても活用でき、車内の各種装置の名称を発話すると、それについての詳細な説明が表示される。
ニュアンスの事業開発部門の関係者は「BMWとは『ハイブリッド』方式の音声認識導入について3年半ほど協議してきたが、実際の量産品開発は約1年で完了できた」と説明した。
Copyright © ITmedia, Inc. All Rights Reserved.