クルマの操作に関する音声認識は自前で、だからこそ「ハーイ、メルセデス」:車載情報機器
メルセデス・ベンツ日本は2018年10月18日、東京都内で会見を開き、コンパクトカー「Aクラス」の新モデルを発表した。音声認識機能を充実させた新開発のインフォテインメントシステム「MBUX(メルセデスベンツユーザーエクスペリエンス)」を初めて採用したモデルとなる。
メルセデス・ベンツ日本は2018年10月18日、東京都内で会見を開き、コンパクトカー「Aクラス」の新モデルを発表した。音声認識機能を充実させた新開発のインフォテインメントシステム「MBUX(メルセデスベンツユーザーエクスペリエンス)」を初めて採用したモデルとなる。音声認識機能は「ハーイ、メルセデス」と話しかけることで起動し、「暑い」「おなかがすいた」といったあいまいな発言から指示内容を理解して車載情報機器の操作を行う。
新型Aクラスの受注は会見と同日に開始した。納車は2018年12月以降となる。パワートレインは、排気量1.4l(リットル)の直列4気筒ガソリンターボエンジンに7速DCT(デュアルクラッチトランスミッション)を組み合わせる。価格は322万円から。
クラウドと組み込みのハイブリッド、流行語も学習
MBUXは、車内での理想的なユーザーエクスペリエンスの実現を目指して開発した。クルマのユーザーエクスペリエンスに対する期待が変化していることを踏まえ、短い期間で開発を反復しながら機能を追加できる「アジャイル開発」で進めたという。Harman International(ハーマン)や、自動車向けの音声認識技術に強いNuance Communications(ニュアンス)といったサプライヤーと共同開発した。ハーマンはシステムのベースとなるソフトウェアや、欧州仕様で搭載するARナビゲーションなどを手掛ける。ニュアンスと共同開発した音声認識機能は、クラウドに接続したオンラインの状態だけでなく、車載情報機器の組み込みシステムのみでも音声を処理できる。組み込みとクラウドの両方の処理結果のうち、より確からしい方をドライバーへの返答とする。
MBUXは、人工知能(AI)技術によってユーザーの使い方も学習する。例えば、決まった時間に特定のラジオの放送局を選択するユーザーには、その選局を勧める。ただ、新型Aクラスに関しては、ユーザーの使い方のデータをクラウドに集めて分析するものの、学習結果をパーソナライゼーションに反映するところまでは行わない。使い方を分析、学習した結果は、全てのユーザーに還元するという。
現在、MBUXとしては13カ国語の音声処理に対応しているが、日本仕様の新型Aクラスは日本語のみの認識となる。日本語版の開発もニュアンスが協力した。日本語対応で苦労したのは、独特な言語体系や漢字の音訓読みの使い分けだという。方言や地域ごとのイントネーションの違いにも対応している。
流行語など新しい言葉にも対応する。クラウド側でも理解できない特定の表現が多くのユーザーによって使われた場合、新しい言葉として学習し、音声認識エンジンをアップデートする。
また、MBUXのユーザーが利用した音声入力のデータは、ユーザーの合意を得た上で個人情報として安全に扱い、今後の開発に活用する。例えば、需要のある機能の分析や、今後必要となる機能の検討に利用していく。改善した音声認識アルゴリズムは、クラウド経由の音声処理であれば反映後すぐに利用できるようになる。
MBUXの音声認識機能で操作できるのは、目的地の入力や電話の発信、音楽の再生、メッセージの入力や読み上げ、気象情報の検索といった車載情報機器の機能だ。また、カーエアコンの温度調整や照明の色の変更、サンルーフ搭載車の室内側のシェードを電動で開閉するといった快適装備も音声入力で操作できる。カーエアコンの温度操作に関しては、運転席と助手席のどちらからの音声かを識別し、助手席からの音声であれば助手席側の温度を調整する。「クルーズコントロールを作動させて」といった走行機能に関わる音声操作はできない。また、セキュリティ上の理由から、サンルーフなどの開閉も音声入力で操作することはできない。
MBUXにGoogle(グーグル)やAmazon(アマゾン)が手掛ける音声アシスタントを使わなかったのは、「車載情報機器の画面のことだけでなく車両全体を包括的に扱い、運転中の人間工学的に正しく、車内での特別な経験を提供できる機能」(Daimler(ダイムラー) MBUXインタラクションコンセプト担当マネジャーのトビアス・キーファー氏)を搭載することが理由だ。
スマートフォンと車載情報機器の音声認識機能を使い分けるのではなく、インフォテインメントシステムと車両の装備両方を1つの音声認識機能で操作できることを重視した。また、ノイズを含めた車内の音に関わる環境条件についての知見を基に音声認識アルゴリズムを調整できることも、自前で音声認識機能を開発する上で強みになった。
グーグルやアマゾンのスマートスピーカーと連携する環境も用意している。Mercedes-Benzブランドのテレマティクスサービス「Mercedes me connect」を通じて、家にあるスマートスピーカーから車両の状態を確認するといった機能が一部の市場では利用可能になっている。日本市場向けにもこうした機能の導入を検討している。キーファー氏は「移動は家から始まり、クルマを降りた後も目的地までの移動がある。スマートフォンのアプリを活用しながら、クルマの中と外で同じ体験を提供することを重視している」と説明した。
IT大手が開発する音声アシスタントと自動車が連携することは珍しくなくなってきた。しかし、車内専用の音声認識機能が不要になるわけではなく、自動車メーカーが家庭用のスマートスピーカーまで自前で展開することも現実的ではない。ユーザーの立場に立てば、どの会社が開発した音声アシスタントであるかはあまり重要にならないだろう。それらを踏まえると、自動車メーカーが手掛けた音声アシスタントとIT大手が開発する音声アシスタントが共存し、ユーザーが違いにストレスを感じることなくスムーズに使えることが理想的だと言えそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- トヨタがLINEとクルマの音声認識で協業、アップルとグーグルへの対抗意識鮮明に
トヨタ自動車とLINEは、LINEが開発を進めるクラウドAIプラットフォーム「Clova」と、トヨタ自動車などが推進する車載情報機器とスマートフォンアプリの連携規格SDLの活用で協業する。2018年をめどに、Clovaの音声エージェント技術を活用した新しいカーサービスの商品化を目指す。 - 音声認識の覇権を握る「Amazon Alexa」、逆転の余地はまだある?
「CES 2017」で一躍存在感を高めた音声認識インタフェース「Amazon Alexa」。既に覇権を握りつつあるという見方も多い。それでも競合他社にとってまだ逆転の余地は残されているようだ。 - “使えない”クルマの音声認識が“使える”ようになる日は近い
音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。 - BMW純正の音声入力機能、スマートフォンの音声エージェントと何が違う?
今後の音声入力機能はどのような処理が主流になるのか。「新車装着用の音声入力は組み込みとクラウドの併用だ」とNuance Communicationsは見込んでいる。 - 「OK Google、クルマのエンジンをかけて」、三菱自が2018年からスタート
三菱自動車は「第45回東京モーターショー 2017」において、スマートスピーカーの「Amazon Echo」や「Google Home」を通じてエンジンの始動やエアコンの設定、ドアの解錠・施錠を行う様子を紹介した。スマートスピーカーの普及が先行している北米で、2018年から同様のサービスを提供する。 - 三菱自動車のAIアシスタント「リサ」、表情や声からドライバーを理解
三菱自動車は「自動車技術展:人とくるまのテクノロジー展2017」において、AI(人工知能)パーソナルアシスタント「RISA」を紹介した。 - 「ナイトライダー」が現実に、音声アシスタントの進化が止まらない
脚光を浴びるIoT(モノのインターネット)だが、製造業にとってIoT活用の方向性が見いだしきれたとはいえない状況だ。本連載では、世界の先進的な事例などから「IoTと製造業の深イイ関係」を模索していく。第3回は、IoTと人工知能(AI)との連携によって進化が加速している音声アシスタント機能の動向に迫る。 - なぜ自動車業界がアジャイル開発? 異業種のライバルと対等に渡り合う手段に
「第3回オートモーティブ・ソフトウェア・フロンティア」のセッションから、アジャイル開発の導入に関する講演を抜粋して紹介する。