デジタル人材の育成
ロボットの制御は非常に複雑である。ロボットに使われるアクチュエータの種類など、様々な要因によってその制御パラメータは簡単に変化する。また、ロボットの種類は多種多様であり、それぞれにあった制御プログラミングは非常に大変である。そこで、本プロジェクトでは、どんなロボットでも制御可能な、機械学習を用いた汎用制御システムを開発する。
本システムは、アクチュエータとしてサーボモータを使ったロボットを対象とした、汎用制御システムとしての実現を目標にする。学習するタスクは、目的地までの歩行動作である。これを実用的な時間内に学習する。これらの目標を達成するために、深層強化学習をベースとしたアルゴリズムを使用する。それに加えて、脊椎動物が取り入れている歩行動作の生成器である中枢パターン発生器のアルゴリズムを使用する。これにより、歩行などのリズム性のある動作の学習が容易になるとともに、学習により生成される動作パターンも安定したものになる。
本システムは事前学習フェーズ、実機学習フェーズを通じて、実際のロボットを動かす方法を獲得する。事前学習フェーズでは、シミュレーションにより様々な機構を持つCGモデルの動作の学習を行う。学習したモデルをもとに、実機学習フェーズで、特定の実機のための学習を行う。強化学習を行う際には、目標値と現在のエージェント(ロボット)の状況(位置)を与える必要がある。そこで、実機学習フェーズでは、スマートフォンとARコードを利用して、誰でも簡単に学習環境が用意できるソフトウェアを作成する。
本プロジェクトの新規性は、一つのシステムで、様々なロボットが制御可能になる点である。これにより、機械制御においてユーザは手作業によるパラメータ調節などの作業から解放されることになる。また、ロボット制御の敷居が下がることで、多くの人々が多様なロボットを作れるようになり、ロボットの多様性が広がることが期待される。
ディープラーニングが普及してきた昨今、ロボットの制御への活用も進んでいるが、全ての制御を大型のコンピュータで計算するのは現実的ではない。だからといって、従来のフィードバック制御では細かな制御を行うのは難しい。そのような中で、脊椎動物の持つ機能を模倣した制御アルゴリズムをつくり、より短時間でさまざまなロボットを稼動させることを目指す本プロジェクトは、意義深い。ディープラーニングだけで制御するロボットが大脳だけで制御させるものだとすると、今回のプロジェクトは大脳と協調して脊椎での自律を実現するものであり、実用現場における自律制御をより発展させることを期待して採択した。