2021-09-10 專題討論問題記錄

--- title: 2021-09-10 專題討論問題記錄 tags: 討論記錄 disqus: hackmd --- # 2021-09-10 與老師討論 ## 目前實驗 ### 目前排名 ![](https://i.imgur.com/FMJnf7O.png) ### EasyOCR 成績 #### 實驗一 : test要預測的範圍，直接丟模型預測 ![](https://i.imgur.com/Rfe2H6l.png) * 查看成果發現，垂直方向的字EasyOCR辨識效果很差 ![](https://i.imgur.com/vkPmaCn.png) #### 實驗二 : 做影像前處理，若是垂直方向的字，由**抓字模型**抓到的字位置，重新拼接影像為水平字 ![](https://i.imgur.com/LAwySTl.png) * 成績: ![](https://i.imgur.com/Y8m2QHT.png) * 辨識成果 ![](https://i.imgur.com/qzXwwjn.png) ### PaddleOCR 成績 #### test要預測的範圍，直接丟模型預測 ![](https://i.imgur.com/3Nc0FCL.png) ### YOLO 訓練模型成績 #### 參數&訓練資料 **Train -> img-384、batch-16** **500字，800張圖，10 epochs** ![](https://i.imgur.com/5a6LZkx.png) #### 直接預測 * 成績 ![](https://i.imgur.com/89aGFe5.png) * 辨識成果 ![](https://i.imgur.com/Djd8VO1.png =17%x) #### 直接預測和預測沒字合併 * 成績 ![](https://i.imgur.com/6Kl1pPq.png) * 辨識成果 ![](https://i.imgur.com/jG5ccPM.png =15%x) * **500字數就可達到0.32(遠少於EasyOCR、PaddleOCR能夠辨識的字數)，不過目前還沒有對yolo字數缺少導致的分數較低問題做處理。** **後續幾天透過加字數、訓練資料、epochs，以上模型能夠辨識更多字!!!** #### 比賽字集加入訓練以上述得到的權重為基礎，加入比賽提供的圖繼續訓練，mAP上不去，就不繼續訓練了 ## 一些重大發現 * 要使用IOU重疊要另外開一個參數 --agnostic-nms ![](https://i.imgur.com/7GRsrgJ.png) 之前測試在沒開啟 agnostic-nms 會有iou-thres改不動的結果，測試開啟後就沒問題了目前測試參數，如上圖，結果算是相對比較好的! * 預測影像大小(128, 256)會影響成果先前Detect部分，就算是Train給img-384，測試的時候仍有很多問題，就有發現Detect給的img會影響預測結果! * 在仔細觀察和實驗後，得知YOLOv5在做Detect時候的縮放會以給的img大小為基準點，做比例縮放 ex. 圖片 64x128 Detect給384 ---> 輸出會是 192x384 而在測試的時候有發現，當圖片的最小邊大概在96、128的時候辨識成果會好非常多，如下圖 ![](https://i.imgur.com/lDUj7Ij.png) 所以就直接到程式內部做修改，把原本的機制更改成預設最小邊96做縮放，然後先使用100字做訓練，結果出來令人感動QQ ![](https://i.imgur.com/Zu43kQQ.png =80%x) 大部分都能準確識別了，只要有涵蓋的字，都能有還不錯的辨識率! ---> 後面也有使用500字訓練做測試，結果也都好非常多! ![](https://i.imgur.com/ZcTUTSh.png =80%x) ## 會議錄影 https://youtu.be/m80WV3M6CRY