# 增強式學習 ###### tags: `20200801` `DeepLearning` 黃國勝教授 國立中山大學電機工程學系 ## 人工智慧產學研聯盟 NAR Labs ## 增強式學習簡介 很少提到的一類,但是很重要 數學很少,所以選這個來做研究 ### Introduction to Reinforcement Learning MachineLearning 三大類 1. 監督式學習 累積人類的智慧,給他題目和答案讓它學。 2. 非監督式學習 錯了就打他,用暗示性的來讓它學,很像是建構式數學 3. 增強式學習 透過不斷的練習,告訴他贏或輸,讓它從步驟中學習 #### 什麼問題才可以使用增強式學習呢? 1. 需要有學習者 2. 行動可以有決策,且行動會造成環境改變 3. 環境會給予獎勵 Actor / Policy Action = pi(Observation) > 目標就定為得到最好的獎賞 > [color=#bc10bc] 這個獎賞必須是所有獎勵的加總,才能避免掉入陷阱 ### Policy Based RL Modal-based 就是建立一個模擬器模型可以去玩 Modal-free 就是在真實世界的環境去執行 Policy-based 知道政策 Value-based 知道數值 ### Value Based RL (實在聽不懂) ### Q-Learning 時間關係跳過去 ## 增強式學習應用 ### Behavior Control by RL and IRL 球跟機器人的距離當作獎賞,所以機器人就會去追球 反過來的話,就會去躲球 ### Robots Dispatch (Machine Scheduling) ### Chip Probe on a Wafer (Mowing)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up