ヒューマノイドロボ「NAO」の日本語能力を高める音声合成エンジン「AITalk」:ROBOTECH 次世代ロボット製造技術展
仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した。
仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」(会期:2013年7月3〜5日/場所:東京ビッグサイト)に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した(関連記事:おフランス生まれのヒューマノイド「NAO」がついに日本語をマスター!?)。
NAOは、世界70カ国の教育・研究機関などで3500体以上が活用されているプログラミング可能な自律型ヒューマノイドロボットである。全長57cmと小型ながら、「歩く」「見る」「聞く」といった基本機能と、人間や他のNAOとの相互コミュニケーションなどを実現する。日本でも大学を中心に採用が進んでおり、ロボット工学、人工知能、コンピュータサイエンス、情報工学、機械、スマートハウス、画像処理、パターン認識などの学習および研究開発に生かされているという。
今回、NAOで強化されたのが日本語機能である。具体的には、日本語に対応した音声合成技術を採用することにより、流暢(りゅうちょう)な日本語が話せるようになった。この音声合成技術を提供しているのがエーアイだ。日本国内で音声合成技術一筋で取り組んできたエーアイの高品質音声合成エンジン「AITalk」のベース部分をミドルウェアとして提供し、NAOの日本語機能の向上に役立てられている。
右側の銀色の機体にエーアイの音声合成エンジン「AITalk」が搭載されている。展示会場では、「NAO」自身が自分の機能や特徴を自己紹介。概要を一通り説明した後、「もう少し詳しい話を聞きたいですか?」と来場者に問い掛けたり、クイズを出したりしていた
AITalkとは、従来の機械音ではなく、あらかじめ、収録された音声データを基に、音声データベースを構築。その音声データベースから、インプットされた任意のテキスト情報を機械的に音声化(収録した人の声で音声合成)する技術である。「音声合成の技術は世の中に幾つかあるが、エーアイの場合、人間の声に近い自然な音声が特徴で、防災無線を使用する『全国瞬時警報システム(J-ALERT)』や、スマートフォンおよび給湯器などの音声案内/音声サービスでも活用されている」(説明員)。
また、事前に行う音声の収録も特徴的で、30文字程度の文章を複数(最小205文章)読み上げるだけで、音声データベースを短期間で構築できてしまうという。「ここで読み上げる文章自体に意味はないが、そこには音声データベースを構築する上で必要な“音”が含まれている。ここにエーアイのノウハウが詰まっている」と説明員。
ちなみに、音声認識技術については、別の企業のエンジンを使用しているとのこと。今回の展示会では、デモンストレーションという位置付けで強化された日本語機能が披露されたが、後日、きちんと対話できるレベルのものをリリース(ソフトウェアアップグレードで提供)する予定だという。
ロボット開発の最前線
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- おフランス生まれのヒューマノイド「NAO」がついに日本語をマスター!?
仏アルデバラン・ロボティクス(Aldebaran Robotics)は、自律型ヒューマノイドロボット「NAO Next Gen(NAO Next Generation)」を、2013年7月3〜5日の3日間、東京ビッグサイトで開催される「ROBOTECH 次世代ロボット製造技術展」に出展。日本語能力が向上したNAOの最新機能を披露する。 - 美少女ゲームのヒロインがあなたの名前をリアルタイムに読み上げる、3DS向け音声合成
エーアイは、同社の組み込み機器向け音声合成ライブラリ「micro AITalk」を、任天堂の携帯型ゲーム機「ニンテンドー3DS」向けに軽量化し、「micro AITalk for ニンテンドー3DS」として販売する。 - エーアイの音声合成エンジン「micro AITalk」が高機能ポータブルナビに採用
エーアイの音声合成エンジン「AITalk」を組み込み機器向けに小型化した「micro AITalk」が、ユピテルの連携・拡張機能型 高機能ポータブルナビYERAシリーズに採用された。