AI音声認識APIを提供する開発プラットフォームを一般公開：人工知能ニュース

アドバンスト・メディアは、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform」の一般公開を開始した。リアルタイム版とバッチ版のAI音声認識APIをラインアップしている。

[MONOist] PC用表示関連情報

LINE

Hatena

　アドバンスト・メディアは2019年12月3日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform（アミボイス・クラウド・プラットフォーム）」の一般公開を開始した。第1弾として汎用エンジンを公開、リアルタイム版とバッチ版のAI（人工知能）音声認識APIをラインアップしている。

音声認識APIを提供する「AmiVoice Cloud Platform」（クリックで拡大）出典：アドバンスト・メディア

　AmiVoiceは、日本語に強い音声認識エンジンで、最新の深層学習技術を実装。今回、APIとして提供することで、音声文字化や音声対話、音声制御、音声翻訳などを行うアプリケーションやWebサイトといったサービスに音声認識APIを簡単に組み込めるようになる。

　リアルタイム認識（WebSocket対応API）とバッチ認識（HTTP対応API）を用意。リアルタイム認識は、HTML5でマイク音声が取得可能なWebブラウザなどで、サーバ型リアルタイム処理ができる。バッチ認識は、音声を一括処理できる。どちらも、サンプルプログラムを用意している。

　また、ビジネスユースに強い言語モデルを採用。ビジネスシーンに特化した言語フィルタリングを搭載することで、不要語を省いて誤認識を軽減している。製品名や固有名詞など、単語のカスタマイズ登録ができるので、専門用語などの認識と変換がよりスムーズになる。

　初月は無料（20日以降の申し込みは翌月まで無料）で、翌月以降も毎月60分までは無料で利用できる。それ以上は従量課金制で、発話区間に対する秒あたりの単価で計算する。無音やノイズ区間など、人の声がない区間は料金が発生しない。価格は、音声データのログを保存する場合が0.025円／秒、保存しない場合が0.04円／秒だ（各税別）。

AI音声認識APIを提供する開発プラットフォームを一般公開：人工知能ニュース

関連記事

関連リンク