ニュース
» 2022年07月08日 08時00分 公開

話者の感情分析もできる、開発者向け音声認識AIエンジンプラットフォーム人工知能ニュース

アドバンスト・メディアは2022年7月7日、同社の音声認識AI技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。自社のアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。

[池谷翼,MONOist]

 アドバンスト・メディアは2022年7月7日、同社の音声認識AI(人工知能)技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。顧客企業が開発するアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。

話し言葉を自然な文章に変換

 AmiVoiceは話し言葉を自然なテキストに変換できる音声認識エンジンで、特に日本語の認識において強みを持つ。ビジネスシーンに即さない言い回しや言葉を除外してAIの学習を行っており、文章化した際に不適切な言葉が現れる可能性が低い。製造や物流、医療や金融など、業界ごとの専門用語に合わせた音声認識エンジンも提供している。

 主なサービス利用者としては、自社でアプリケーション開発を行うITベンダーなどを想定する。AmiVoice Cloud Platformで開発したアプリケーションは、社内での活用に加え、社外に提供するサービスとして展開することもできる。

AmiVoice提供のための開発者向けプラットフォーム[クリックして拡大] 出所:アドバンスト・メディア

 サービス提供方式は主に「AmiVoice API」「AmiVoice API Private」「AmiVoice SDK」の3種類がある。AmiVoice APIはAPIによって、顧客企業がアプリケーションにライブラリを組み込むことなくAmiVoiceを利用できるようにする。初期費用は0円で、1時間当たり99円の従量課金制での提供となる。AmiVoice API Privateは顧客企業が持つサーバ上にAmiVoiceの利用環境を構築するもので、AmiVoice SDKは自社アプリケーションにAmiVoiceを組み込むためのSDKである。

AmiVoice Cloud Platformの主な提供方式[クリックして拡大] 出所:アドバンスト・メディア

 またAmiVoice APIのオプション機能として「感情解析API」も提供する。イスラエルのNemesyscoが提供する感情解析エンジンをベースに開発したもので、「喜び」「怒り」「期待」など20個の感情パラメータを指標に、話者の感情を解析する。コンタクトセンター向けの提供を想定しており、電話をかけた人物と、電話を受けたオペレーターの感情変化をゲージの色の濃淡でリアルタイムに可視化する機能もある。会話の中で「怒り」などの感情が一定時間継続したと判断した場合、管理者に対してアラートを送信する。

 コンタクトセンター以外でも、小売店舗の購買傾向分析などにも活用できる可能性がある。利用料金は1秒当たり0.04円。

 アドバンスト・メディアにおけるサービス開発の展望について、同社 事業本部 PF D&O部 パートナー推進グループ セクションマネージャーの山下雄也氏は「最新の深層学習技術を活用し、英語や中国語の音声認識精度向上を目指す。対応可能な言語の種類も拡充し、目的特化型のエンジン開発も進める。またAmiVoice Cloud Platformでは、話者を特定する技術がバッチ認識のみで使用できるが、これをリアルタイム音声認識でもできるようにしたい」と語った。

⇒その他の「組み込み開発ニュース」の記事はこちら

Copyright © ITmedia, Inc. All Rights Reserved.