AI音声認識APIを提供する開発プラットフォームを一般公開人工知能ニュース

アドバンスト・メディアは、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform」の一般公開を開始した。リアルタイム版とバッチ版のAI音声認識APIをラインアップしている。

» 2019年12月25日 07時30分 公開
[MONOist]

 アドバンスト・メディアは2019年12月3日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス・クラウド・プラットフォーム)」の一般公開を開始した。第1弾として汎用エンジンを公開、リアルタイム版とバッチ版のAI(人工知能)音声認識APIをラインアップしている。

photo 音声認識APIを提供する「AmiVoice Cloud Platform」(クリックで拡大) 出典:アドバンスト・メディア

 AmiVoiceは、日本語に強い音声認識エンジンで、最新の深層学習技術を実装。今回、APIとして提供することで、音声文字化や音声対話、音声制御、音声翻訳などを行うアプリケーションやWebサイトといったサービスに音声認識APIを簡単に組み込めるようになる。

 リアルタイム認識(WebSocket対応API)とバッチ認識(HTTP対応API)を用意。リアルタイム認識は、HTML5でマイク音声が取得可能なWebブラウザなどで、サーバ型リアルタイム処理ができる。バッチ認識は、音声を一括処理できる。どちらも、サンプルプログラムを用意している。

 また、ビジネスユースに強い言語モデルを採用。ビジネスシーンに特化した言語フィルタリングを搭載することで、不要語を省いて誤認識を軽減している。製品名や固有名詞など、単語のカスタマイズ登録ができるので、専門用語などの認識と変換がよりスムーズになる。

 初月は無料(20日以降の申し込みは翌月まで無料)で、翌月以降も毎月60分までは無料で利用できる。それ以上は従量課金制で、発話区間に対する秒あたりの単価で計算する。無音やノイズ区間など、人の声がない区間は料金が発生しない。価格は、音声データのログを保存する場合が0.025円/秒、保存しない場合が0.04円/秒だ(各税別)。

Copyright © ITmedia, Inc. All Rights Reserved.