高速道路の騒音でも実用的な音声認識、スマートグラスと現場へ:IoT/M2M展
アドバンスト・メディアが「IoT/M2M展」に展示しているウェアラブルグラスは「高速道路の高架下ぐらいの音量があっても、問題なく音声で入力できる」音声入力機能を搭載。現場での“真のハンズフリー”を実現する。
アドバンスト・メディアが「IoT/M2M展」に展示しているウェアラブルグラスは音声認識による入力を実装、ボタンやタッチパネルの操作を不要にすることで、“真のハンズフリー”を実現する。既に工場などでの試験導入が開始されており、これまでボタンや画面タッチで行っていた入力を音声入力に代替し、作業効率や作業品質を向上させる狙いだ。
“両手を離せる”特長を持つウェアラブルグラスのメリットを生かすため、入力に音声入力を利用するというアイデアはそう珍しいものではないが、生産や検査などの現場で利用する際には、周囲の騒音による認識精度の低下が問題となっていた。
同社では最適なマイクの選定とノイズキャンセリングを始めとしたソフトウェアのチューニングなどで大音量環境下での認識精度低下を克服、100デシベルの環境下でも問題なく認識できる製品とした。「高速道路の高架下ぐらいの音量があっても、問題なく音声入力が利用できる」(同社)
展示されていたウェアラブルグラスはウエストユニティスの「InfoLinker」。InfoLinkerはOSにAndroid 4.2.2を利用しており、音声認識はアドバンスト・メディアの音声認識ソフト「AmiVoice」のAndroid用SDKを利用して実装されている。
音声認識に必要な集音能力の改善という意味では、韓MightyWorksの開発した音声高音質化ミドルウェアも興味深い(国内取扱はグレープシステム)。これは音源へのズーミングやオートボリューミングなど音声認識の前処理として実装することで、音声認識の認識率向上を図る。
音源へのズーミングはビームフォーミング技術によるもの。無指向性マイク2つで事前設定した以外の範囲の音を減衰させることで、結果的に無指向性マイクを利用しながらも指向性マイクを利用したような集音性能を持たせることが可能となり、その処理も専用DSPなしでのソフトウェア実装となる。
グレープシステムではズーミング処理だけならばCortex-M4クラス、周辺処理を入れてもCortex-M7クラスの処理能力で十分に対応できるとしており、ウェアラブルデバイスのハンズフリー通話機能や電話会議システム、低価格カーナビへの搭載などが期待できそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- “手の届く人工知能”コールセンターやスマホアプリに
アドバンスト・メディアが“手の届く人工知能”をうたう、人工知能活用の音声対話システム「AmiAgent」を発売する。マートフォンアプリや自動応答電話サービス、ロボット、カーナビゲーションシステムなどの用途への導入を狙う。 - 市販スマートグラスで“現場の見える化”を安価に、京セラが提案
京セラコミュニケーションシステムが「第4回 IoT/M2M展」にて、エプソンのスマートグラス「MOVERIO」を利用した作業工程管理システムを紹介した。市販品を採用することで導入コストを下げ、幅広い現場での利用を狙う。 - ウェアラブルデバイスが変革する生産現場・保守現場の未来像
「第25回 設計・製造ソリューション展(DMS2014)」では、ウェアラブルデバイスの活用により生産や保守の“現場”を革新するさまざまなソリューションが出展された。「現場×ウェアラブル」で何が起ころうとしているのか。 - 現場のハンズフリー化を促進、富士通がタフ機能備えたHMD
富士通が企業向けウェアラブル端末「FUJITSU IoT Solution UBIQUITOUSWARE」を発売する。防水や防じん、耐落下などタフネス性能も備え、さまざまな現場での利用が見込まれる。 - 工場作業を音声認識で支援! 最大100デシベルの騒音下で対話可能な音声認識端末
アドバンスト・メディアは「第1回 ウェアラブルEXPO(装着型デバイス 技術展)」において、最大100デシベルの騒音環境でも音声認識・音声対話が行える専用ウェアラブルデバイスを出展。騒音が多い工場作業などでも音声認識を利用することが可能だ。