AI音声認識APIを提供する開発プラットフォームを一般公開:人工知能ニュース
アドバンスト・メディアは、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform」の一般公開を開始した。リアルタイム版とバッチ版のAI音声認識APIをラインアップしている。
アドバンスト・メディアは2019年12月3日、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス・クラウド・プラットフォーム)」の一般公開を開始した。第1弾として汎用エンジンを公開、リアルタイム版とバッチ版のAI(人工知能)音声認識APIをラインアップしている。
AmiVoiceは、日本語に強い音声認識エンジンで、最新の深層学習技術を実装。今回、APIとして提供することで、音声文字化や音声対話、音声制御、音声翻訳などを行うアプリケーションやWebサイトといったサービスに音声認識APIを簡単に組み込めるようになる。
リアルタイム認識(WebSocket対応API)とバッチ認識(HTTP対応API)を用意。リアルタイム認識は、HTML5でマイク音声が取得可能なWebブラウザなどで、サーバ型リアルタイム処理ができる。バッチ認識は、音声を一括処理できる。どちらも、サンプルプログラムを用意している。
また、ビジネスユースに強い言語モデルを採用。ビジネスシーンに特化した言語フィルタリングを搭載することで、不要語を省いて誤認識を軽減している。製品名や固有名詞など、単語のカスタマイズ登録ができるので、専門用語などの認識と変換がよりスムーズになる。
初月は無料(20日以降の申し込みは翌月まで無料)で、翌月以降も毎月60分までは無料で利用できる。それ以上は従量課金制で、発話区間に対する秒あたりの単価で計算する。無音やノイズ区間など、人の声がない区間は料金が発生しない。価格は、音声データのログを保存する場合が0.025円/秒、保存しない場合が0.04円/秒だ(各税別)。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- MaaS時代のクルマは視線もインタフェースに、音声と視線認識技術を握るCerence
自動運転やMaaSの社会実装が進む中、クルマが提供する体験価値も変革が求められている。音声認識に強みを持つ車載ソフトウェアベンダーのCerenceもクルマの新たな価値を提案する企業の1社だ。同社は視線検知と音声認識を組み合わせ、乗員とクルマの双方向コミュニケーションを実現するインタフェースを開発している。 - ドライバーモニタリング用カメラの用途さまざま、脈拍測定から音声認識まで
三菱電機は「第46回東京モーターショー2019」(会期:2019年10月24日〜11月4日、東京ビッグサイト他)において、MaaS(Mobility-as-a-Service、自動車などの移動手段をサービスとして利用すること)用の車両向けの乗員センシング技術を発表した。 - 小型組み込み機器向け音声合成エンジンの提供を開始
エーアイは、ルネサス エレクトロニクスの「RZ/G Linuxプラットフォーム」向け音声合成エンジン「microAITalk」の提供を開始した。小型ロボット、スマートフォンアプリケーションなど、組み込み機器へ音声読み上げ機能の搭載が可能になる。 - オープンソースの音声認識APIを特徴とする車載Linuxの最新版を発表
Automotive Grade Linux(AGL)は、オープンソースの音声認識APIを特徴とする車載Linuxの最新版「Unified Code Base(UCB)7.0」をリリースした。また、AGLに新たに加盟した5社について発表した。 - AI通訳機の日本語音声の新エンジンに音声合成ミドルウェアが採用
東芝デジタルソリューションズは、「RECAIUS 音声合成ミドルウェア ToSpeak」がソースネクストのAI通訳機「POCKETALK W」の新たな日本語音声のエンジンとして採用されたことを発表した。 - トヨタがLINEとクルマの音声認識で協業、アップルとグーグルへの対抗意識鮮明に
トヨタ自動車とLINEは、LINEが開発を進めるクラウドAIプラットフォーム「Clova」と、トヨタ自動車などが推進する車載情報機器とスマートフォンアプリの連携規格SDLの活用で協業する。2018年をめどに、Clovaの音声エージェント技術を活用した新しいカーサービスの商品化を目指す。