過去學相關課程時,我記得老師很突然地就開始教強化學習了,也沒說為什麼,完全找不到時機問「為什麼用強化學習?」最近複習筆記時這個問題又浮上心頭,不可能只有我很好奇這件事吧?於是在查資料後,總算是搞懂了那些技術之間的關係,試著用自己的話來解釋看看。
***
機器學習的三種方式
機器學習裡最常見的分類方式將模型分成三大類:監督式學習、非監督式學習與強化學習。
一般課程都是從監督式學習開始學起,然後再談非監督式學習,最後再講強化學習,所以我一直以為它們是從初階、中階到最高階的關係,結果完全不是!它們只是對應不同類型任務的不同訓練方法,就像是早餐店賣的蔬菜蛋餅、培根蛋餅和鮪魚蛋餅一樣,只是口味不同,沒有孰優孰劣的問題。
image