仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した。
仏アルデバラン・ロボティクス(Aldebaran Robotics)は、「ROBOTECH 次世代ロボット製造技術展」(会期:2013年7月3〜5日/場所:東京ビッグサイト)に出展し、同社の自律型ヒューマノイドロボット「NAO」で新たに強化された日本語機能に関するデモンストレーションを披露した(関連記事:おフランス生まれのヒューマノイド「NAO」がついに日本語をマスター!?)。
NAOは、世界70カ国の教育・研究機関などで3500体以上が活用されているプログラミング可能な自律型ヒューマノイドロボットである。全長57cmと小型ながら、「歩く」「見る」「聞く」といった基本機能と、人間や他のNAOとの相互コミュニケーションなどを実現する。日本でも大学を中心に採用が進んでおり、ロボット工学、人工知能、コンピュータサイエンス、情報工学、機械、スマートハウス、画像処理、パターン認識などの学習および研究開発に生かされているという。
今回、NAOで強化されたのが日本語機能である。具体的には、日本語に対応した音声合成技術を採用することにより、流暢(りゅうちょう)な日本語が話せるようになった。この音声合成技術を提供しているのがエーアイだ。日本国内で音声合成技術一筋で取り組んできたエーアイの高品質音声合成エンジン「AITalk」のベース部分をミドルウェアとして提供し、NAOの日本語機能の向上に役立てられている。
AITalkとは、従来の機械音ではなく、あらかじめ、収録された音声データを基に、音声データベースを構築。その音声データベースから、インプットされた任意のテキスト情報を機械的に音声化(収録した人の声で音声合成)する技術である。「音声合成の技術は世の中に幾つかあるが、エーアイの場合、人間の声に近い自然な音声が特徴で、防災無線を使用する『全国瞬時警報システム(J-ALERT)』や、スマートフォンおよび給湯器などの音声案内/音声サービスでも活用されている」(説明員)。
また、事前に行う音声の収録も特徴的で、30文字程度の文章を複数(最小205文章)読み上げるだけで、音声データベースを短期間で構築できてしまうという。「ここで読み上げる文章自体に意味はないが、そこには音声データベースを構築する上で必要な“音”が含まれている。ここにエーアイのノウハウが詰まっている」と説明員。
ちなみに、音声認識技術については、別の企業のエンジンを使用しているとのこと。今回の展示会では、デモンストレーションという位置付けで強化された日本語機能が披露されたが、後日、きちんと対話できるレベルのものをリリース(ソフトウェアアップグレードで提供)する予定だという。
Copyright © ITmedia, Inc. All Rights Reserved.