話者の感情分析もできる、開発者向け音声認識AIエンジンプラットフォーム:人工知能ニュース
アドバンスト・メディアは2022年7月7日、同社の音声認識AI技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。自社のアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。
アドバンスト・メディアは2022年7月7日、同社の音声認識AI(人工知能)技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。顧客企業が開発するアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。
話し言葉を自然な文章に変換
AmiVoiceは話し言葉を自然なテキストに変換できる音声認識エンジンで、特に日本語の認識において強みを持つ。ビジネスシーンに即さない言い回しや言葉を除外してAIの学習を行っており、文章化した際に不適切な言葉が現れる可能性が低い。製造や物流、医療や金融など、業界ごとの専門用語に合わせた音声認識エンジンも提供している。
主なサービス利用者としては、自社でアプリケーション開発を行うITベンダーなどを想定する。AmiVoice Cloud Platformで開発したアプリケーションは、社内での活用に加え、社外に提供するサービスとして展開することもできる。
サービス提供方式は主に「AmiVoice API」「AmiVoice API Private」「AmiVoice SDK」の3種類がある。AmiVoice APIはAPIによって、顧客企業がアプリケーションにライブラリを組み込むことなくAmiVoiceを利用できるようにする。初期費用は0円で、1時間当たり99円の従量課金制での提供となる。AmiVoice API Privateは顧客企業が持つサーバ上にAmiVoiceの利用環境を構築するもので、AmiVoice SDKは自社アプリケーションにAmiVoiceを組み込むためのSDKである。
またAmiVoice APIのオプション機能として「感情解析API」も提供する。イスラエルのNemesyscoが提供する感情解析エンジンをベースに開発したもので、「喜び」「怒り」「期待」など20個の感情パラメータを指標に、話者の感情を解析する。コンタクトセンター向けの提供を想定しており、電話をかけた人物と、電話を受けたオペレーターの感情変化をゲージの色の濃淡でリアルタイムに可視化する機能もある。会話の中で「怒り」などの感情が一定時間継続したと判断した場合、管理者に対してアラートを送信する。
コンタクトセンター以外でも、小売店舗の購買傾向分析などにも活用できる可能性がある。利用料金は1秒当たり0.04円。
アドバンスト・メディアにおけるサービス開発の展望について、同社 事業本部 PF D&O部 パートナー推進グループ セクションマネージャーの山下雄也氏は「最新の深層学習技術を活用し、英語や中国語の音声認識精度向上を目指す。対応可能な言語の種類も拡充し、目的特化型のエンジン開発も進める。またAmiVoice Cloud Platformでは、話者を特定する技術がバッチ認識のみで使用できるが、これをリアルタイム音声認識でもできるようにしたい」と語った。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 高速道路の騒音でも実用的な音声認識、スマートグラスと現場へ
アドバンスト・メディアが「IoT/M2M展」に展示しているウェアラブルグラスは「高速道路の高架下ぐらいの音量があっても、問題なく音声で入力できる」音声入力機能を搭載。現場での“真のハンズフリー”を実現する。 - 音声認識の覇権を握る「Amazon Alexa」、逆転の余地はまだある?
「CES 2017」で一躍存在感を高めた音声認識インタフェース「Amazon Alexa」。既に覇権を握りつつあるという見方も多い。それでも競合他社にとってまだ逆転の余地は残されているようだ。 - “使えない”クルマの音声認識が“使える”ようになる日は近い
音声認識システム開発の大手・Nuance Communications(ニュアンス)がシリコンバレーで最新技術説明会を開催。車載器とクラウドの双方で音声認識処理を連携して行う「ハイブリッド」方式のデモを行った。さらに、人工知能技術の活用により、Appleの「Siri」をはるかに上回るレベルの音声認識技術も開発中だという。 - ダイハツが販売店の整備に音声認識技術を導入、点検結果を自動入力
ダイハツ工業は、定期的なクルマの点検/整備時に、整備士の音声を認識し、点検結果が自動入力されるシステムを新開発した。販売会社で約1年間の実証実験を行い改良を重ねたもので、2018年2月3日に新装開店となる高知ダイハツ販売の南国店に正式導入される。 - 音声認識に視線や感情、眠気検知を組み合わせ、より柔軟なエージェントに
Nuance Communications(ニュアンス)は、消費者向けエレクトロニクス展示会「CES 2019」(2019年1月8〜11日、米国ネバダ州ラスベガス)において、カメラによる視線検知と音声認識技術を組み合わせた開発中の新機能を披露した。開発技術は、POI(Point of Interest)検索やストリーミングサービス、リアルタイムな情報を得る場合にはクラウド連携が必要だが、それ以外については車載情報機器側で処理が終えられるという。