1.強化學習介紹 :zap:
強化學習是機器學習中的一種策略,我們會設定要演算法達成的目標,然後根據演算法嘗試的結果給予回饋值 (達成目標給予正回饋、失敗則給負回饋)
直到能順利達成目標獲得正回饋為止。
2.強化學習架構 :zap:
:arrow_right: 損失函數 Loss Function
Loss Function 會給出一個值來評斷我們與目標的距離,當 Loss 越小就離目標越近。
:arrow_right: 環境 Environment & 狀態 State
bernie6401 changed 3 months agoView mode Like 2 Bookmark