続いて、松野氏は「制御」と「学習」の違いについて触れ、“ロボットの知能”について紹介した。
生まれたばかりの人間は、最初何もできないが、成長・学習するにつれて、ハイハイができ、つかまり立ちができ、ヨチヨチ歩きができ、二足歩行ができ、走ることができるようになっていく。「制御というと人間がロボットに動き方をあらかじめ教え込む(プログラムする)ことになる。これに対し、学習は人間のように、ロボットが何も分からない状態から学んで・成長していくということだ。ただし、学習の場合は、“成功”に対して報酬を与える・褒めることで、それが正しいものであると、人間が教えてあげる必要がある(その逆も)」という。
試行して(ある状態で適当な行動を起こして)、それが成功であれば褒められる。そうなると、どんどん練習を繰り返して、成否を学び、成功するための行動が強化されていく。これを「強化学習」というそうだ。「例えば、足の上げ下げしか理解していない(真っすぐ歩くことを知らない)多足ロボットが、強化学習を何度も繰り返していくと、最終的に“最適な歩行”を獲得できるようになる」(松野氏)。この多足ロボット事例は、シミュレータ上での検証だが、実際に、アクロバットロボットに鉄棒の蹴上がりの練習を何度もさせた結果、最終的に、1回前に振り出して反動を付けてから、その勢いを使って2回目で蹴上がりを成功させるというプロセスを“ロボットなりに”確立できたという。
なぜ、体操選手のように1回で蹴上がりできないのか。これが何を意味しているのか……。それはつまり、強化学習を通じ、ロボットが持つそもそもの能力や環境などから、“自分に合ったやり方を自らが導き出した”ということだ。「この結果は、私も予想できなかった。これが、守破離の“破”に相当する段階かもしれない。型を守るだけではダメで、“自分の身体にあった動かし方”を身に付け、獲得していかなければならない。先ほどのロボットが2回目で蹴上がりしていたのは、強化学習により得た、そのロボットにとっての最善のやり方なのだ」(松野氏)。
「われわれ生物は、その身体に合った運動知能をどんどんと獲得していっているはず。だから、知能は脳ではなく、身体に宿る。私は、運動が全ての知能を生み出した根源だと考えている。例えば、腰を落として、重いものを持ち上げる際、『うっ!!』と声を発して力を入れることがある。これが実は音声が生まれたきっかけになったのではないかと思う。運動が基になり、声が生まれてきて、それがコミュニケーションという知的なツールに進化していったのではないだろうか」(松野氏)。
さて、残る“離”の段階だが、現状でその境地に立つロボットは恐らく存在しないだろう。“離”の境地に達するということは、生物の能力を完全に超えたことを意味するからだ。
松野氏は「人間をはじめとする地球上にいる全ての生物は、本当に素晴らしく、洗練された技(動き)を会得している。それは地球誕生以来、長い歴史の中で自然淘汰を繰り返しながら、生き残ってきたものだからだ。だからこそ、そうした生物から技を学び、ヒントを得て、ロボットに応用していくことに大きな意味がある。そして、こうしたアプローチを繰り返し行っていくことで、将来、生物を超えるロボットを生み出してみたい」と語る。
Copyright © ITmedia, Inc. All Rights Reserved.