ニュース
「印象指定」でイメージ通りの音声合成、東芝が開発
東芝が年齢や性別、明るさなどの特徴を指定することで、利用イメージに即したさまざまな合成音声を生成できる「声デザイン技術」を開発した。
東芝は2016年3月8日、年齢や性別、明るさなどの特徴を指定することで利用イメージに即したさまざまな声を生成できる「声デザイン技術」を開発したと発表した。音声広告やコミュニケーションロボット、カーナビゲーションシステムの音声ガイダンスなどの用途に向けての利用が期待され、まずは2016年度中に同社クラウド「RECAIUS」への搭載を目指す。
東芝「声デザイン技術」
合成音声はナビゲーションや広告、ロボットのコミュニケーション手段など、さまざまな用途に使われているが、サンプルから選択する場合は選択肢が限られ、また、多数のサンプルがある場合でも、意図する特徴の声を選択するためには手間がかかっていた。
同社の開発した「声デザイン技術」では、声を年齢や性別、明るさなど知覚できる特徴ごとに分解・モデル化した「知覚語空間モデル」を開発。モデルによって生成される“平均的な声”をもとに、知覚できるパラメーターを変化させることで、目的に合った声を作り出す。
同社では本技術を操作するGUIも試作した。操作画面上で「かわいい」「丁寧」「知的」といった声の印象を表す言葉を選び、そこに「性別」「年齢」「明るさ」といった要素を加味することで、求めるイメージに近い声を生成できる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 自然な動作で耳穴生体認証、NECが開発
NECが耳の反響特性を利用した生体認証技術を開発した。音楽を聞くような動作での認証が可能で、作業や移動中の認証も行える。 - 東急が駅混雑の様子を配信、個人特定できない処理を施し
東急電鉄が駅構内や改札の様子を映像で配信するサービスの実験を開始する。混雑の様子が確認できながらも、個人を特定できない処理を施す。 - OLED採用で「スクリーン感なし」、スマートグラス「MOVERIO」に第3世代製品
セイコーエプソンが同社で初めて有機ELを採用したスマートグラス「BT-300」を発表。「スクリーン感を意識させない映像表現」(同社)を可能にした他、軽量化も進めた。 - 東芝のB2B向けウェアラブル端末が発売中止に、事業見直しの一環で
東芝は2016年2月29日よりの販売を予定していたメガネ型ウェアラブル端末「Wearvue(ウェアビュー)TG-1」の発売及び開発中止を決定した。 - 機械と電話のハイブリッド翻訳、京急で試験導入
京急電鉄と情報通信研究機構(NICT)、ブリックスは鉄道分野における外国人との円滑なコミュニケーションを目的とした実験を開始する。翻訳アプリに電話翻訳のサービスを組み合わせ、有用性を検証する。