障害物を認知して経験を積み重ね最適ルートをその場で強化学習します。

ニューラルネットワーク(mlp)に環境とアクションの関係を習得させます(現在改良中)。