###### tags: `MLCC` # Validation Set ::: success **Validation Set 會出現的原因** 如果只有 ***Training set*** and ***test set*** ,在訓練 model的過程中,拿 trainning set 訓練,訓練後又把結果和 test set 比對,計算誤差值,若是結果不好會再訓練一次。 這個做法會讓 test set 很常暴露出來,可能會造成 overfitting的問題,所以再切了一個 Validation Set 當作訓練後計算誤差值的數據,最後訓練OK的 model ,再拿去計算 test set。也就是當作 double check 的作用。 ::: #### Training set and Test set 訓練 model流程圖 ![](https://i.imgur.com/NeANrSp.png) #### 加入 Validation set 訓練 model流程圖 ![](https://i.imgur.com/GPuuzxt.png) ## 可能的工作流程 - Tweak model: 可以調整以下條件產生我們想要的 model > 1. 可以調整超參數 > 2. 加入或是移除 feature ## 將一個完整的數據切成3份 1. Training set 2. Test set 3. Validation set ## 更好的工作流程 - 選一個在 validation set 最好的model - 最好的 model 去驗證 test set => double check