カーシェアや交通機関を外国人にも使いやすく、話者に合わせて言語を自動切換え:CES2020
英語で話しかけると英語で、ドイツ語で話しかけるとドイツ語で、乗客の問いかけに答えるバスが2020年内にも走り出す。
英語で話しかけると英語で、ドイツ語で話しかけるとドイツ語で、乗客の問いかけに答えるバスが2020年内にも走り出す。問いかけの言語に合わせて表記を切り替える、窓の透明なサイネージも搭載している。交通機関のユーザーインタフェースの多言語対応を進めるだけでなく、自動運転化によって乗務員が車内にいない場合にも母国語で情報を得られるようにする。
車両は自動運転が可能な電動小型バスで、音声認識技術を手掛けるCerence(セレンス)、ZF資本のe.GO MOOVEと素材メーカーのSaint-Gobain Sekuritの3社が開発。消費者向けエレクトロニクス展示会「CES 2020」(2020年1月7〜10日、米国ネバダ州ラスベガス)において、英語とドイツ語に対応したバスを披露した。
2語程度で言語を識別
乗客が話している言語の種類は、それぞれの言語に特有な発音の仕方を基に識別する。乗客が発話したうちの2語程度で、それがどの言語であるかを認識することができるという。CES 2020に出展した車両の場合は、英語とドイツ語の認識エンジンで乗客の発話を最後まで聞き両方の言語の確度を比較したうえでドイツ語か英語かを判断する。
ただ、スペイン語とイタリア語のように、発音が似ている言葉は誤認識が起きやすいという課題がある。バスでどの言語をサポートするか、何カ国語を車両のシステムに搭載するかは、地域ごとに検討が必要だ。個人所有の乗用車であれば言語の切り替えは初期設定で十分だが、どんな人がいつ乗車するか分からない交通機関では、言語の切り替えを意識させないことが利便性向上につながる。交通機関だけでなく、旅行者などが多く利用するレンタカーやシェアカーでも需要を見込む。
また、披露したバスは自然言語理解に対応しており、「このバスはどこに行きますか?」「次のバスはいつですか?」といったバスの運行に関する問いかけから質問内容を理解する。「ドアを開けて」と乗るために操作することも可能だ。「バス停の近くに24時間営業のレンタカーはある?」といった目的地付近の施設の情報や、交通機関の乗り継ぎに関する質問にも答える。質問に回答する際の合成音声は、渋滞による遅延などでおわびするときなど場面に合わせた抑揚をつけることもできるという。
言語の識別や自然言語認識は組み込みソフトウェアで処理する。バスの運行や施設情報など変化するデータは、クラウドから情報を得る。バスには車内外にマイクが取り付けられており、乗る前に目的地に行くバスか確かめることができる。車内には指向性マイクを設置し、発話した人に向けて回答をフィードバックする。混んだバス内での音声認識に抵抗がある人向けに、運行情報などを確認できるタブレット端末も用意する予定だ。
実際に試してみると、車両が英語とドイツ語を対象としていたこともあり、日本語が母国語の人間が話しかけても、音声認識機能を起動するウェイクワードの認識さえうまくいかない場合があった。これは、日本語話者の英語の発音やアクセントを学習していないためだ。ただ、セレンスでは、話者の多様性を反映し、米国英語の認識アルゴリズムには米国で人口の多い非英語地域出身者のアクセントも学習させている。
日本人が話す英語など、母国語以外の言語を話す場合の認識については「技術的には可能だが、費用対効果としてどうか。日本人には日本語というように、母国語で話せるように搭載する方がユーザーインタフェースとしては親切だ」(セレンスの担当者)としている。
セレンスは、音声認識技術を手掛けるNuance Communications(ニュアンス)から2019年10月にスピンアウトした。ニュアンスのビジネスでは車載向けの比率は高くなく、セレンスとして独立し、インフォテインメントシステムの理解が深い技術者をトップとして招くことで事業の進め方が変わった様子だ。一方、車両を開発するe.GO MOOVEは、e.GO MobileとZFの共同出資会社で、自動運転シャトルの開発、生産を手掛ける。
関連記事
- 音声認識に視線や感情、眠気検知を組み合わせ、より柔軟なエージェントに
Nuance Communications(ニュアンス)は、消費者向けエレクトロニクス展示会「CES 2019」(2019年1月8〜11日、米国ネバダ州ラスベガス)において、カメラによる視線検知と音声認識技術を組み合わせた開発中の新機能を披露した。開発技術は、POI(Point of Interest)検索やストリーミングサービス、リアルタイムな情報を得る場合にはクラウド連携が必要だが、それ以外については車載情報機器側で処理が終えられるという。 - MaaS時代のクルマは視線もインタフェースに、音声と視線認識技術を握るCerence
自動運転やMaaSの社会実装が進む中、クルマが提供する体験価値も変革が求められている。音声認識に強みを持つ車載ソフトウェアベンダーのCerenceもクルマの新たな価値を提案する企業の1社だ。同社は視線検知と音声認識を組み合わせ、乗員とクルマの双方向コミュニケーションを実現するインタフェースを開発している。 - ドライバーモニタリング用カメラの用途さまざま、脈拍測定から音声認識まで
三菱電機は「第46回東京モーターショー2019」(会期:2019年10月24日〜11月4日、東京ビッグサイト他)において、MaaS(Mobility-as-a-Service、自動車などの移動手段をサービスとして利用すること)用の車両向けの乗員センシング技術を発表した。 - 人間の肉声に近い高品質な音声波形を高速に合成できる新手法を開発
国立情報学研究所は、高品質な音声を高速に合成する手法「ニューラル・ソースフィルター・モデル」を開発した。人間の肉声に近い高品質な音声波形を生成できる。 - “使えない”クルマの音声認識が“使える”ようになる日は近い
音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。 - インフォテインメントは乗員みんなで使う、日産が進めるナビとスマホアプリの連携
日産自動車は、「インテリジェントモビリティ」の要素の1つで、つながる便利さを提供する「インテリジェントインテグレーション」の取り組みの一環で、出発前から到着後まで、車内外の体験をシームレスにつなげるパーソナルサービスの開発を進める。その例が「コネクテッドアプリコンセプト」だ。
Copyright © ITmedia, Inc. All Rights Reserved.