ロボットが強化学習すれば
これまでにない進化が得られる

スイスのチューリッヒ工科大学の Robotic Systems ラボで開発されたANYmal は、防水・防塵性能に優れ、あらゆる地形に対応してスムーズに移動できる画期的な犬型四脚ロボットだ。

高度な自律性を持つことから、オペレーターが操作せずとも、人間が踏み入れることができない場所で作業をしたり、物資を運搬したりすることができる。それゆえ、被災地での救助作業を中心に活躍が期待されている。

2016年に設立された会社、ANYbotics で商品化されると、常にその機能をアップデートさせてきた。とはいえ、ロボットに新たな動作を教え込むには膨大なコストと時間、そして労力がいる。

その問題をある程度解決するには、適切なシミュレーション・システムを備えて、ロボット自らが強化学習することが求められる。Robotic Systems ラボは、それが可能だと実証する論文を発表した。

この論文のなかには、「シミュレーションデータを、以前よりも簡単に、ロボットへ変換できるニュートラル・ネットワークが開発できた」と書かれている。

このネットワークにより、同時に2000台の ANYmal の動作を、リアルタイムでシミュレーションすることができるという。それはつまり、どんなアルゴリズムがどんな結果をもたらすのかを、短時間で調べることが可能になったということだ。

さらなる進化を果たした ANYmal は、エネルギー効率がアップし、スピード・ウォーキング記録を25%上回り、加えて、一定の速度で動くという命令にも従うことができる。

しかも人間がどんなに転ばそうとして蹴ったとしても、常に直立状態を保つことができるばかりか、驚くべきことに、転倒させた場合は、どんな姿勢であっても自ら起き上がる能力を獲得したのだそうだ。

この従来の方法では得られなかった進化は、同様の複雑さを持つ他の四脚ロボットにはないものだ。これからも強化学習によって ANYmal がいったいどんな進化を遂げるのか? 期待せずにはいられない。