--- title: 2021-09-10 專題討論問題記錄 tags: 討論記錄 disqus: hackmd --- # 2021-09-10 與老師討論 ## 目前實驗 ### 目前排名  ### EasyOCR 成績 #### 實驗一 : test要預測的範圍,直接丟模型預測  * 查看成果發現,垂直方向的字EasyOCR辨識效果很差  #### 實驗二 : 做影像前處理,若是垂直方向的字,由**抓字模型**抓到的字位置,重新拼接影像為水平字  * 成績:  * 辨識成果  ### PaddleOCR 成績 #### test要預測的範圍,直接丟模型預測  ### YOLO 訓練模型成績 #### 參數&訓練資料 **Train -> img-384、batch-16** **500字,800張圖,10 epochs**  #### 直接預測 * 成績  * 辨識成果  #### 直接預測和預測沒字合併 * 成績  * 辨識成果  * **500字數就可達到0.32(遠少於EasyOCR、PaddleOCR能夠辨識的字數),不過目前還沒有對yolo字數缺少導致的分數較低問題做處理。** **後續幾天透過加字數、訓練資料、epochs,以上模型能夠辨識更多字!!!** #### 比賽字集加入訓練 以上述得到的權重為基礎,加入比賽提供的圖繼續訓練,mAP上不去,就不繼續訓練了 ## 一些重大發現 * 要使用IOU重疊要另外開一個參數 --agnostic-nms  之前測試在沒開啟 agnostic-nms 會有iou-thres改不動的結果,測試開啟後就沒問題了 目前測試參數,如上圖,結果算是相對比較好的! * 預測影像大小(128, 256)會影響成果 先前Detect部分,就算是Train給img-384,測試的時候仍有很多問題,就有發現Detect給的img會影響預測結果! * 在仔細觀察和實驗後,得知YOLOv5在做Detect時候的縮放會以給的img大小為基準點,做比例縮放 ex. 圖片 64x128 Detect給384 ---> 輸出會是 192x384 而在測試的時候有發現,當圖片的最小邊大概在96、128的時候辨識成果會好非常多,如下圖  所以就直接到程式內部做修改,把原本的機制更改成預設最小邊96做縮放,然後先使用100字做訓練,結果出來令人感動QQ  大部分都能準確識別了,只要有涵蓋的字,都能有還不錯的辨識率! ---> 後面也有使用500字訓練做測試,結果也都好非常多!  ## 會議錄影 https://youtu.be/m80WV3M6CRY
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up