運転中の音声入力の認識率を3割向上、運転席からの声だけを拾う:オートモーティブワールド 2017
新日本無線は、「オートモーティブワールド2017」において、雑音の多い走行中の車内でも音声認識の精度を向上する技術を紹介した。
新日本無線は、「オートモーティブワールド2017」(2017年1月18〜20日、東京ビッグサイト)内の「第9回 国際カーエレクトロニクス技術展」において、雑音の多い走行中の車内でも音声認識の精度を向上する技術を紹介した。ドライバーが発した声のみを抽出して雑音を除去することで、音声入力アプリでの認識処理を行いやすくする。
デモンストレーションでは、同社のMEMSマイクアレー、信号処理プロセッサ、オーディオアンプ、電源回路、Bluetoothモジュールを組み合わせた認識支援モジュールを用いた。この認識支援モジュールをBluetoothでiPhoneとペアリングし、スマートフォンのマイクの代わりに使用する。認識支援モジュールが音声認識を行いやすい状態に処理した音声を、音声エージェント「Siri」のクラウドサーバで処理した。
MEMSマイクアレーは2つ組み合わせる。これにより、運転席の方向から発した声のみを拾い、助手席や後部座席の声、ロードノイズやカーオーディオの音は除去する。デモンストレーションでは、認識モジュールの左側つまり助手席を想定した位置から発した声は認識せず、右側の運転席を想定した位置からの音声は認識した。なお展示会場内は、多くの参加者により騒々しい環境にある。
音源の分離や雑音除去のアルゴリズムは、新日本無線が開発した。同社はこれまでに、オーディオ機能向けの音源処理や、車室内での音楽の聞こえ方の処理などで実績があったが、音声認識向けの処理は初めて手掛けた。
認識支援モジュールとスマートフォンを組み合わせて運転中の音声認識処理を実験した結果、窓を開けてエアコンの風量を最大にした条件ではスマートフォン単体で音声入力アプリを利用するよりも認識率が2〜3割向上したという。
同社では認識支援モジュールとしての製品化は考えておらず、車載情報機器メーカーにデバイスや音声処理アルゴリズムの技術を提案していきたい考えだ。
関連記事
- カーナビの音声認識使ってる? 運転中の“ながら”SNSに20〜30代が興味
Nuance Communications(以下、ニュアンス)は、日本市場におけるカーナビゲーションシステム(カーナビ)のユーザーを対象にした音声認識機能の利用実態調査を実施。その結果、20〜30歳代のユーザーの使用頻度が高く、特に音声認識機能を使った運転中のSNSメッセージの送信などに興味を持っていることが分かった。 - スマートフォンの音声アシスタントと雑談したことがある人は20歳代で46%
ニュアンス コミュニケーションズ ジャパンは、日本国内の自動車保有者1100人を対象に実施した音声認識機能の利用調査結果を発表した。車載情報機器の音声認識機能に対する総合的な満足度は向上しているものの、音声認識機能の利用者は自動車保有者の2割弱にとどまることが分かった。 - 工場作業を音声認識で支援! 最大100デシベルの騒音下で対話可能な音声認識端末
アドバンスト・メディアは「第1回 ウェアラブルEXPO(装着型デバイス 技術展)」において、最大100デシベルの騒音環境でも音声認識・音声対話が行える専用ウェアラブルデバイスを出展。騒音が多い工場作業などでも音声認識を利用することが可能だ。 - Pepperの音声認識を使ってクイズアプリを作る
Pepperには音声認識機能が搭載されており、GUIで簡単に「音声に反応するロボット」をプログラミングできる。プログラミングに有効な「ボックス」の使い方も覚えよう。 - 古くて新しい組み込み技術「音声認識/合成」のいま
古くから研究開発されてきた音声認識/音声合成。近年この分野が大きく進化している。ESECで見た最新動向を紹介しよう
Copyright © ITmedia, Inc. All Rights Reserved.