判斷結果好不好的方法

###### tags: `SBD` # 判斷結果好不好的方法 # 分類指標(目標為離散的) [參考網站](https://medium.com/nlp-tsupei/roc-pr-%E6%9B%B2%E7%B7%9A-f3faa2231b8c) ## Accuracy - 所有分類正確的樣本佔全部樣本的比例 - ACC = (tp + tn) / 全部樣本 ## Precision & Recall [參考網站](https://chingtien.medium.com/%E5%BF%83%E7%90%86%E5%AD%B8%E5%92%8C%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E4%B8%AD%E7%9A%84-accuracy-precision-recall-rate-%E5%92%8C-confusion-matrix-529d18abc3a) [評估模型指標](https://ithelp.ithome.com.tw/articles/10218575) [例子] - 用"狼來了"的故事，分成四類 - 前情 : positive 檢測到狼.negative 沒檢測到狼. - 這裡的狼代表真實結果，呼喊代表預測結果 ![](https://i.imgur.com/4cyacJ7.png) - 1. True Positives : 狼來，小孩叫 - 2. False Positives : 狼沒來，小孩叫 - 3. False Negatives : 狼來，小孩沒叫 - 4. True Negatives : 狼沒來，小孩也沒叫 #### Precision : 當小孩說了狼來了，真的狼來了機率 - True Positive Rate - 這個值越大越好 ![](https://i.imgur.com/ZsJg1Op.png) #### Recall : 進入村莊的狼，我們發現的機率 - - 這個值越大越好 ![](https://i.imgur.com/ynA81Hj.png) - 兩個機率相互影響，如果Recall 要提升，連風吹草動都要說狼來了 - 如果不想要說了之後發現狼沒來，那就要變嚴格 - 有一個指標是ROC 指標 - 結合上面兩者得出的 ### f1 score - 越大越好 ### f2 score ## ROC [參考網址](https://estat.pixnet.net/blog/post/61795603-roc%E6%9B%B2%E7%B7%9A-%28receiver-operating-characteristic-curve%29) - 不同 thershold 的recall & precision 結果曲線 ![](https://i.imgur.com/rnyogsJ.png) ## AUC(曲線下面積) = 表示“ROC 曲線下面積” - 用AUC 的計算 : AUC值越大，結果越正確，如果AUC = 0.5 ，那就和隨機丟銅板一樣 - 我們希望AUC = 1(但是是不可能的) ## F - Score ![](https://i.imgur.com/qoyXFEp.png) - f 後面的數字是 β 的值 - β = 1 => f1 # 迴歸指標(目標為連續的數值) ## RMSE ## MSE ## MAE