| 
以下のような開発を行なった.
(1) アルゴリズム開発
時系列パターンを学習する再帰型の自己組織化マップ (Self-Organizing Map=SOM) 及び再帰型自己組織化マップを改変したアルゴリズムの開発を行なった.自己組織化マップは次の特徴を持ったニューラルネットワークである.
・教師無し競合型のニューラルネットワークである.
・入力層と出力層の2層構造を持つ.
・高次元の入力データを低次元の出力層に対して位相マッピングする.
・汎化・分類を行なう.
それに加えて再帰型自己組織化マップは,次の特徴を持ったニューラルネットワークである.
・時系列データに対応する.
・1ステップ前の競合層の活性度を状態として持ち時系列データの分類が可能である.
本プロジェクトでは,自己組織化マップ及び再帰型自己組織化マップを拡張したアルゴリズムを開発した.特徴は,以下の通りである.
・同構造の自己組織化マップを複数並列に置き相互に1ステップ前の活性度を参照し,入力軌道パターン間の相関関係を学習できる.
・予想出力が行えるようになっている.
太田 図1が開発した並列再帰型自己組織化マップの概念図を示す.

太田 図1 開発した並列再帰型自己組織化マップ
(2) 実証実験用プログラムの設計および開発
AIBOを駆動するための開発プラットホームであるOPEN-R及びTekkotsu Framework上において,上記アルゴリズムを用いた行動学習システムを構築した.太田
図2に開発・実行環境を示す.

太田 図2 開発及び実行環境
(3) 実証実験
センサーと関節角度の軌道パターン (時系列データ) を入力し,並列再帰型自己組織化マップをトレーニングした.今回は,足関節,距離センサー,角センサーを対象とした.さらに,AIBOのセンサーデータを並列再帰型自己組織化マップに入力し,関節角度の軌道データを予測出力させ,AIBOの関節角度をセットするのものとした.
実験は,上記条件において,次の手順で行った.
[1]「お座り」の状態を基本とし,「お座り」の状態の時に手を近づける (距離センサーの値が小さい) と「お手」 (左前脚を上げる)
をし,「お座り」の状態の時に頭を撫でる (角センサがONになる) と「立ち」の状態に移行し,「立ち」の状態の時に手を近づけると「お座り」の状態に移行するように学習させた.実際にAIBOを稼動させたところ,このとおりの動作をすることが確認できた.
[2] 1に続き,手を近づけると「お手」をする軌道パターンの学習の際,「お手」に関係する左前脚と距離センサー以外の軌道パターンを左前脚と距離センサーに対して無相関なデータを学習させた.実際にAIBOを稼動させたところ,「立ち」の状態の際に,手を近づけた際,立ったまま「お手」をしたり,「お座り」に移行したりすることが確認された.
太田 図3はこの実験に含まれた状態遷移を表す.

太田 図3 AIBOの訓練パターンと発生したエラーパターン
「立ち」状態の時に手を出すと,本来ならば「お座り」の状態に戻るところが,「立ちながらお手」という予想外の行動が生まれた.これは,次のように説明ができる.最初の学習においては,「お手」は全ての関節角度と全てのセンサーの軌道パターンに相関があることから,全ての並列再帰型自己組織化マップ間に対応関係が作られた.これは「お手」モジュールが全ての並列再帰型自己組織化マップにまたがっている事を意味する.しかし,次の学習で,距離センサーと右前脚のみの軌道パターンの相関が学習されたことで,「お手」モジュールは距離センサーと左前脚に対応する並列再帰型自己組織化マップのみに限定された.つまり,動的にモジュールの範囲が変わったと言える
(太田 図4).あるいは,各並列再帰型自己組織化マップを1モジュールとみなすと,モジュール間の対応関係が動的に変化したとも言える.このようにモジュール構成の動的な変化をエンターテイメントロボットに導入した場合,予想外の行動を生成する可能性を持つことができ,より新しいエンターテイメント性をもたらすことができるだろう.
太田 図4 「立ちながらお手」が発生した理由
|