機械との対話が自然かつ滑らかに、ヤマハの自然応答技術を電子工作基板に搭載:組み込み開発ニュース
スイッチサイエンスは、ヤマハが開発した自然応答技術「HEARTalk」を搭載する電子工作向け基板「HEARTalk UU-001」の販売を開始する。HEARTalkを使えば、従来は単調だった機械の応答音声が、人間にとって自然な、強さ、抑揚、間、高さで返ってくるようになるという。
スイッチサイエンスは2017年6月6日、ヤマハが開発した自然応答技術「HEARTalk」を搭載する電子工作向け基板「HEARTalk UU-001」の販売を開始すると発表した。スイッチサイエンスのWebサイトにおける税込み単価は9180円となっている。
HEARTalkは、人間と機械の会話を自然に行うためにヤマハが開発した独自技術だ。人間の呼びかけの音楽的要素である韻律(発話の声の強弱、長短、高低、間、抑揚)をリアルタイムに解析し、応答に適した自然な韻律を導出する。従来は単調だった機械の応答音声が、人間にとって自然な、強さ、抑揚、間、高さで返ってくるようになるという。
HEARTalk UU-001は、電子楽器「ウダー」を製作する宇田道信氏が企画を担当しており、自作の工作機械やロボットにHEARTalkを組み込むための電子工作向け基板となっている。
HEARTalk UU-001の電源を入れると、入力された音声を解析し、応答に適した自然な韻律の音声を出力する。音声入力は、ボード上に実装されているマイクに向かって話しかける形で行う。音声出力は、同梱のスピーカー(接続もしくははんだ付けが必要)とヘッドフォン端子からの出力に対応している。電源は、USB miniB、もしくは電源コネクターから電池などを利用できる。
拡張機能として、制御用GPIOと応答音声書換え機能も備えている。制御用GPIOは、他のマイコンと接続しHEARTalk UU-001を制御するためのもので、発音の種類、タイミング、音量をコントロールできる。応答音声書換え機能は、購入者のオリジナル音声による応答を行えるようにするための機能。PCとUSB接続することで、購入者自身が収録した音声をHEARTalk UU-001にダウンロードして利用できる。
2017年夏には「個人のモノづくり」向けの第3弾製品も
ヤマハは、「個人のモノづくり」の成長性と可能性に着目し、同市場に向けた技術投入やイベント協賛などを積極的に行ってきた。2013年10月には、「VOCALOID」の処理を組み込み用途に最適化した専用音源「eVocaloid」を用いて、バーチャルシンガーによる歌声の出力が行える音源LSI「NSX-1」を搭載した音源基板「eVY1シールド」がスイッチサイエンスから発売されている。
今回のHEARTalk UU-001への技術提供は、eVY1シールドに続く第2弾製品になる。また2017年夏には、第3弾として新しい製品の提供も予定している。「技術・製品投入を加速させることで、当社は今後もより積極的に『個人のモノづくり』を支援していきたい」(ヤマハ)としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 音声認識の覇権を握る「Amazon Alexa」、逆転の余地はまだある?
「CES 2017」で一躍存在感を高めた音声認識インタフェース「Amazon Alexa」。既に覇権を握りつつあるという見方も多い。それでも競合他社にとってまだ逆転の余地は残されているようだ。 - 「ナイトライダー」が現実に、音声アシスタントの進化が止まらない
脚光を浴びるIoT(モノのインターネット)だが、製造業にとってIoT活用の方向性が見いだしきれたとはいえない状況だ。本連載では、世界の先進的な事例などから「IoTと製造業の深イイ関係」を模索していく。第3回は、IoTと人工知能(AI)との連携によって進化が加速している音声アシスタント機能の動向に迫る。 - スマートフォンの音声アシスタントと雑談したことがある人は20歳代で46%
ニュアンス コミュニケーションズ ジャパンは、日本国内の自動車保有者1100人を対象に実施した音声認識機能の利用調査結果を発表した。車載情報機器の音声認識機能に対する総合的な満足度は向上しているものの、音声認識機能の利用者は自動車保有者の2割弱にとどまることが分かった。 - 組み込み向け「VOCALOID」だと!? ――ヤマハ、歌って奏でる音源LSIを発表
ヤマハは、リアルで多彩な音色に対応した音源LSI「NSX-1」の量産出荷を開始した。リアルなアコースティックサウンドを再現する音源「Real Acoustic Sound」と、「VOCALOID」を組み込み機器向けに最適化した専用音源「eVocaloid」に対応する。量産出荷に併せ、JavaScriptからNSX-1を制御するためのライブラリと、サンプルWebアプリケーションもオープンソースで公開する。 - 「印象指定」でイメージ通りの音声合成、東芝が開発
東芝が年齢や性別、明るさなどの特徴を指定することで、利用イメージに即したさまざまな合成音声を生成できる「声デザイン技術」を開発した。 - 声色は11種類、音声対話を低価格に実現する組み込みボード「Ruby Board」
日立超LSIシステムズが、日本語の音声認識機能と音声合成機能を標準搭載した組み込みボードを発売する。音声認識合成機能の組み込み作業、ライセンスなどの初期費用が不要であるほか、11の話者から好みの声を選択できる。