ヒューマノイドロボ「NAO」の日本語能力を高める音声合成エンジン「AITalk」ROBOTECH 次世代ロボット製造技術展

仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した。

» 2013年07月04日 19時55分 公開
[八木沢篤,MONOist]
NAO

 仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」(会期:2013年7月3〜5日/場所:東京ビッグサイト)に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した(関連記事:おフランス生まれのヒューマノイド「NAO」がついに日本語をマスター!?)。

 NAOは、世界70カ国の教育・研究機関などで3500体以上が活用されているプログラミング可能な自律型ヒューマノイドロボットである。全長57cmと小型ながら、「歩く」「見る」「聞く」といった基本機能と、人間や他のNAOとの相互コミュニケーションなどを実現する。日本でも大学を中心に採用が進んでおり、ロボット工学、人工知能、コンピュータサイエンス、情報工学、機械、スマートハウス、画像処理、パターン認識などの学習および研究開発に生かされているという。

 今回、NAOで強化されたのが日本語機能である。具体的には、日本語に対応した音声合成技術を採用することにより、流暢(りゅうちょう)な日本語が話せるようになった。この音声合成技術を提供しているのがエーアイだ。日本国内で音声合成技術一筋で取り組んできたエーアイの高品質音声合成エンジン「AITalk」のベース部分をミドルウェアとして提供し、NAOの日本語機能の向上に役立てられている。

銀色の機体 右側の銀色の機体にエーアイの音声合成エンジン「AITalk」が搭載されている。展示会場では、「NAO」自身が自分の機能や特徴を自己紹介。概要を一通り説明した後、「もう少し詳しい話を聞きたいですか?」と来場者に問い掛けたり、クイズを出したりしていた
エーアイの高品質音声合成エンジン「AITalk」 エーアイの高品質音声合成エンジン「AITalk」についてのパネル【※画像クリックで拡大表示】

 AITalkとは、従来の機械音ではなく、あらかじめ、収録された音声データを基に、音声データベースを構築。その音声データベースから、インプットされた任意のテキスト情報を機械的に音声化(収録した人の声で音声合成)する技術である。「音声合成の技術は世の中に幾つかあるが、エーアイの場合、人間の声に近い自然な音声が特徴で、防災無線を使用する『全国瞬時警報システム(J-ALERT)』や、スマートフォンおよび給湯器などの音声案内/音声サービスでも活用されている」(説明員)。

 また、事前に行う音声の収録も特徴的で、30文字程度の文章を複数(最小205文章)読み上げるだけで、音声データベースを短期間で構築できてしまうという。「ここで読み上げる文章自体に意味はないが、そこには音声データベースを構築する上で必要な“音”が含まれている。ここにエーアイのノウハウが詰まっている」と説明員。

 ちなみに、音声認識技術については、別の企業のエンジンを使用しているとのこと。今回の展示会では、デモンストレーションという位置付けで強化された日本語機能が披露されたが、後日、きちんと対話できるレベルのものをリリース(ソフトウェアアップグレードで提供)する予定だという。

ロボット開発の最前線

ロボット/ロボット開発コーナー
あらゆる技術の集大成といわれる「ロボット」をテーマに、産業、レスキュー、生活支援/介護分野などにおけるロボット開発の実情や、関連する要素技術、研究開発、ロボットコンテスト、ロボットビジネスの最新動向などをお届けする。

>>ロボット特集のTOPページはこちら


Copyright © ITmedia, Inc. All Rights Reserved.