喧騒の中で自然に対話――子守りロボット「PaPeRo」:パーソナルロボット(1/2 ページ)
NECが、“家庭の実環境”での音声認識性能を向上させた新型パーソナルロボットPaPeRoを開発。応用例として、子供の世話をする「チャイルドケアロボット PaPeRo」をお披露目した。
NECは3月16日、同社のパーソナルロボットのコミュニケーション能力を強化した新型PaPeRo(「PaPeRo 2005」)を開発したと発表。同ロボットの応用例として、子供の世話をする「チャイルドケアロボット PaPeRo」をお披露目した。
2001年に発表した初代(PaPeRo 2001)、2003年にお披露目した2代目(PaPeRo 2003)と、モニタ評価などを参考に改良が加えられてきた同社のパーソナルロボットだが、今回の新型PaPeRoはCPUや各種インタフェースなどを大幅に強化。これら新ハードウェアによって音声認識性能/演算性能/拡張性を向上させ、「雑音下でも音声を聞き取れる能力」や「手書き文字や動画像を認識する能力」、「人と自然に楽しいやりとりができる能力」を付加したという。
従来のPaPeRo | 新型PaPeRo 2005 | |
---|---|---|
CPU | Celeron 500MHz | Pentium-M 1.6GHz |
メモリ | 60M〜192Mバイト | 512Mバイト |
HDD | 6Gバイト | 40Gバイト |
PCカード | なし | 2スロット |
USB IF | USB 1.1×1ポート | USB2.0×2ポート |
電源出力 | なし | 5V/12V |
マイク | 4個(おでこ1、襟3) | 8個(おでこ1、襟7) |
信号処理 | 音源方向検出 | 高精度音源方向検出、雑音除去 |
中でも、家庭用ロボットとして大きな一歩といえるのが、“家庭の実環境”での音声認識性能の向上だ。
ロボットの音声認識デモンストレーションの時に「みなさん、ちょっと静かにしてください」「あ、ちょっと騒がしかったので認識できなかったみたいです」という光景がよくあるが、これは実際の家庭環境を考えたらおかしなことだ。
新型PaPeRoは従来4個だったマイクを8個に増やすとともに、背面の雑音マイクに入る音から周囲の雑音を推定して消去する「ノイズキャンセラ」機能を装備。これにより、雑音環境下での音声認識の誤りが従来の1/3程度に低下して、家庭でテレビが常時ついているような環境でもロボットとの対話を可能にしたという。
発表会場では、背後に大音量でテレビ音声が流れている中で、PaPeRoに話しかけてテレビのチャンネルを切替えたり、プレゼンテーション進行の指示などを行うデモンストレーションを実施。話しかけられたPaPeRoは、騒音をものともせず見事に指示どおりの操作を行って見せた。
また、従来のロボット音声認識では、相手が話し終わるのを待って話しかけるというスタイルだったが、人同士による実際の対話では互いの会話が重なることは当たり前だ。新型PaPeRoでは、より自然な対話を実現するためにPaPeRoが発話中でも音声認識が可能になった。
発話中は、ロボットのスピーカーから発生する音(ロボットの声)が雑音となって音声認識が難しくなっていたが、新型PaPeRoでは音声マイクに入ってくるロボットの声をスピーカー出力から推定して消去する「エコーキャンセラ」機能を装備。これにより、ロボット発話中の音声認識の誤りが従来の1/5程度に低下し、ロボットが発話中でも割り込んで話しかけることができるようになったという。
そのほか、従来から装備していた「音源方向検出」の性能を向上させて呼びかけられた声の到来方向を正確に検出できるようになったほか、紙に書いた手書き文字を読み取る「文字認識」/離れた場所で手を振る人を発見する「手振り検出」/揺れる振り子を認識する「振り子検出」など、内蔵カメラを使ったコミュニケーション能力が大幅に向上。ロボット同士やPCなど情報機器との連携機能も強化された。
「音声を使わずに手書き文字で名前を教えたり、手招きしたら近づく、振り子を見せると眠ってしまうといったジェスチャーを利用した多様なコミュニケーションが可能になった。ネットワーク連携では、ロボット同士で会話したり、複数のロボットによるダンスなどもできるようになった。漫才を取り入れたユーモアのある対話もできるなど、ロボットとの対話をより楽しくするような研究もできるようになっている」(同社)
子守りに特化させた「チャイルドケアロボット PaPeRo」
Copyright © ITmedia, Inc. All Rights Reserved.