人工智慧期中作業

# 論文研究,心得 ## 題目 : A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments 論文簡介:https://arxiv.org/abs/2005.10619 全文:https://arxiv.org/pdf/2005.10619 內容主要分為 ### 簡介：介紹了非穩態強化學習的重要，並提出了該研究領域的問題陳述、目標和貢獻。非穩態強化學習概述：這一部分概述了非穩態環境中的強化學習概念，以及在面對環境變化時所面臨的挑戰。同時，還總結了之前相關工作的概況。 ### 相關領域：持續學習：介紹了持續學習算法在深度神經網絡中的應用，並討論了持續學習算法的優勢和挑戰。元學習方法：討論了元學習方法在解決多任務學習中的應用和挑戰。 ### 應用領域：交通運輸系統：探討了交通系統中強化學習的應用，特別是在處理環境動態變化的情況下。網絡安全：介紹了如何利用強化學習來檢測和應對網絡安全中的異常行為。數字營銷和庫存定價：討論了數字營銷和庫存定價中的強化學習應用，並提出了相應的算法。推薦系統：探討了強化學習在推薦系統中的應用和相關研究進展。機器人技術：介紹了機器人技術中強化學習的應用，特別是在應對不穩定的環境條件下。 ### 未來方向：改進先前的方法：提出了改進先前方法的幾種途徑，包括引入新的理論假設、改善算法的可擴展性等。額外挑戰：討論了該領域尚未解決的挑戰，包括發展對環境變化敏感的算法、解決機器人技術中的數據效率問題等。 ### 心得: 這篇論文有很多的算式,並且也是不熟悉的領域,所以有蠻多地方都看不太懂,不懂的地方就問chatGPT或是上網查資料,看完這篇論文後也是對強化學習中的非穩態學習有了認識,並且也知道了在領域中應該可以如何運用