只利用ray perception sensor 3d來當作觀察 {%youtube Uu5UyKlHcoI %} 本身就會進行像是掃地機器人旋轉的動作 可以看到當射線碰撞到目標Target時,Agent會往他移動 因為希望Agent會一直往Target方向移動,所以我加上了座標 觀察 = ray perception sensor 3d + 座標 訓練50萬次 利益為0.983 {%youtube ItbTPuXaFFk %} 會發現他既不會跑射線的東西也不會以座標去跑 ??書寫射線碰到Target就往她移動的程式,或是更改射線的觀察給予利益?