介紹(隨機森林)
our objective in this study is to train models that are as accurate as the original methods at a lower cost.
focus在Random Forests (RF)
https://www.youtube.com/watch?v=Ix0UhijD4Ks
隨機森林其實就是進階版的決策樹,所謂的森林就是由很多棵決策樹所組成。隨機森林是使用 Bagging 加上隨機特徵採樣的方法所產生出來的整體學習演算法。還記得在前幾天的決策樹演算法中,當模型的樹最大深度設定太大的話容易讓模型過擬合。因此隨機森林藉由多棵不同樹的概念所組成,讓結果比較不容易過度擬合,並使得預測能力更提升。
實作方法
從訓練集中抽取 n’ 筆資料出來