現場でハンズフリーのデータ入力可能に、騒音下でも高精度の音声認識:製造現場向けAI技術
アドバンスト・メディアは2022年7月26日、対話型AI音声入力で現場作業中のデータ入力を効率化するMicrosoft Excel向けアドイン「AmiVoice スーパーボイスエントリー for Excel」の提供を開始すると発表した。
アドバンスト・メディアは2022年7月26日、東京都内の同社本社およびオンラインで記者会見を開き、対話型AI音声入力で現場作業中のデータ入力を効率化するMicrosoft Excel向けアドイン「AmiVoice スーパーボイスエントリー for Excel」の提供を同日より開始すると発表した。
ハンズフリー、アイズフリーでデータ入力
AmiVoice スーパーボイスエントリー for Excelは、Windows端末上でMicrosoft Excelに音声入力機能を追加できるアドイン(機能拡張プログラム)だ。音声認識と音声合成を組み合わせた対話型AI音声入力を用いたデータ入力が可能になる。AI音声認識エンジンAmiVoiceを搭載しており、発話内容の高精度なテキスト変換ができる他、音声合成による項目の読み上げや入力内容の復唱で記録の抜け漏れも防止できる。
製造業、建設業では、まだ点検内容や作業進捗などを紙に書き込む現場が多い。そのシートを管理者がオフィスに持ち帰って、PCに入力する二重作業も発生している。タブレット端末の導入が進んでいるが、現場で入力するたびに手袋を外さないといけなかったり、そもそも作業に追われていたりして現場で使われないケースもある。一方で、就業者の高齢化や人手不足も顕著になっており、作業負担の軽減は急務となっている。
アドバンスト・メディア ビジネス開発センター 営業推進部長の藤枝章氏は「それらの問題は、音声をデータ入力のインタフェースにすることで解決する。音声入力なら作業中の手を止めず、視線も動かすことなく、ハンズフリー、アイズフリーでデータ入力できる」と語る。
同社は企業ごとに現場作業軽減に向けたシステム開発も手掛けてきたが、費用が高額になりがちだった。AmiVoice スーパーボイスエントリー for Excelでは1帳票あたりの開発費用は70万円となっている。
高騒音の環境下でも音声認識
AI音声認識は、個別カスタマイズにより固有名詞や専門用語、略語も正しく認識し、入力時間はキーボード入力に比べて約6分の1まで削減する(同社調べ)。導入に際しては、現行の点検、検査、報告内容を詳細にヒアリング後、対象となるMicrosoft Excel帳票ごとに、入力する項目や順序、音声合成の内容をアドインに設定し、納品する。
音声認識に特化した同社のBluetooth接続型ウェアラブルマイク「AmiVoice Front WT01」を併用すれば、90dB程度の高騒音下でも音声認識できるという。また、同製品を首元にしっかり固定する専用ネックバンドアダプター「AmiVoice Front WT01」も用意されている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 話者の感情分析もできる、開発者向け音声認識AIエンジンプラットフォーム
アドバンスト・メディアは2022年7月7日、同社の音声認識AI技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。自社のアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。 - “使えない”クルマの音声認識が“使える”ようになる日は近い
音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。 - 音声認識に視線や感情、眠気検知を組み合わせ、より柔軟なエージェントに
Nuance Communications(ニュアンス)は、消費者向けエレクトロニクス展示会「CES 2019」(2019年1月8〜11日、米国ネバダ州ラスベガス)において、カメラによる視線検知と音声認識技術を組み合わせた開発中の新機能を披露した。開発技術は、POI(Point of Interest)検索やストリーミングサービス、リアルタイムな情報を得る場合にはクラウド連携が必要だが、それ以外については車載情報機器側で処理が終えられるという。 - AIがコールバック、人工知能活用でコールセンターを低価格に
アドバンスト・メディアらが、音声認識エンジン「AmiVoice」などを活用し、AIでコールセンターの無人化を目指す「AIコンシェルジュ」を提供する。予約の確認といったバックフロー業務も行える。 - 高速道路の騒音でも実用的な音声認識、スマートグラスと現場へ
アドバンスト・メディアが「IoT/M2M展」に展示しているウェアラブルグラスは「高速道路の高架下ぐらいの音量があっても、問題なく音声で入力できる」音声入力機能を搭載。現場での“真のハンズフリー”を実現する。 - 工場作業を音声認識で支援! 最大100デシベルの騒音下で対話可能な音声認識端末
アドバンスト・メディアは「第1回 ウェアラブルEXPO(装着型デバイス 技術展)」において、最大100デシベルの騒音環境でも音声認識・音声対話が行える専用ウェアラブルデバイスを出展。騒音が多い工場作業などでも音声認識を利用することが可能だ。