アドバンスト・メディアは2022年7月7日、同社の音声認識AI技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。自社のアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。
アドバンスト・メディアは2022年7月7日、同社の音声認識AI(人工知能)技術をアプリケーションに組み込んで活用できる開発者向けプラットフォーム「AmiVoice Cloud Platform」の説明会を開催した。顧客企業が開発するアプリケーションに音声認識エンジンを利用したサービスや機能を実装できる。
AmiVoiceは話し言葉を自然なテキストに変換できる音声認識エンジンで、特に日本語の認識において強みを持つ。ビジネスシーンに即さない言い回しや言葉を除外してAIの学習を行っており、文章化した際に不適切な言葉が現れる可能性が低い。製造や物流、医療や金融など、業界ごとの専門用語に合わせた音声認識エンジンも提供している。
主なサービス利用者としては、自社でアプリケーション開発を行うITベンダーなどを想定する。AmiVoice Cloud Platformで開発したアプリケーションは、社内での活用に加え、社外に提供するサービスとして展開することもできる。
サービス提供方式は主に「AmiVoice API」「AmiVoice API Private」「AmiVoice SDK」の3種類がある。AmiVoice APIはAPIによって、顧客企業がアプリケーションにライブラリを組み込むことなくAmiVoiceを利用できるようにする。初期費用は0円で、1時間当たり99円の従量課金制での提供となる。AmiVoice API Privateは顧客企業が持つサーバ上にAmiVoiceの利用環境を構築するもので、AmiVoice SDKは自社アプリケーションにAmiVoiceを組み込むためのSDKである。
またAmiVoice APIのオプション機能として「感情解析API」も提供する。イスラエルのNemesyscoが提供する感情解析エンジンをベースに開発したもので、「喜び」「怒り」「期待」など20個の感情パラメータを指標に、話者の感情を解析する。コンタクトセンター向けの提供を想定しており、電話をかけた人物と、電話を受けたオペレーターの感情変化をゲージの色の濃淡でリアルタイムに可視化する機能もある。会話の中で「怒り」などの感情が一定時間継続したと判断した場合、管理者に対してアラートを送信する。
コンタクトセンター以外でも、小売店舗の購買傾向分析などにも活用できる可能性がある。利用料金は1秒当たり0.04円。
アドバンスト・メディアにおけるサービス開発の展望について、同社 事業本部 PF D&O部 パートナー推進グループ セクションマネージャーの山下雄也氏は「最新の深層学習技術を活用し、英語や中国語の音声認識精度向上を目指す。対応可能な言語の種類も拡充し、目的特化型のエンジン開発も進める。またAmiVoice Cloud Platformでは、話者を特定する技術がバッチ認識のみで使用できるが、これをリアルタイム音声認識でもできるようにしたい」と語った。
Copyright © ITmedia, Inc. All Rights Reserved.