--- title: 2021-08-30 專題討論問題記錄 tags: 討論記錄 disqus: hackmd --- # 2021-08-30 與老師討論 ## 0828討論記錄 https://hackmd.io/@thenextone/H1FsA-wWK ## 目前實驗 (以下實驗都是用YOLO v5) * (一) 原圖所有中文字都標一樣Label **(成果mAP : 0.82)** ![](https://i.imgur.com/uqgg21f.jpg) * (二) 切圖(按照json檔格式把圖先裁下來,重新標註座標)所有中文字都標一樣Label **(成果mAP : 0.985)** ![](https://i.imgur.com/I2He2HO.png) * (三) 原圖所有中文字Label都標不一樣(訓練資料字數 : 2400多個) **(成果mAP : 小於0.1)** ![](https://i.imgur.com/JxlC9y5.jpg) * (四) 切圖(按照json檔格式把圖先裁下來,重新標註座標)所有中文字Label都標不一樣 **(成果mAP : 小於0.1)** ![](https://i.imgur.com/t5sizom.png) ## 討論 * YOLO 丟資料訓練-直接判斷字 ->模擬訓練資料 ![](https://i.imgur.com/Qj9X0wH.png) 結果validation全部為0,是否跟座標都給一樣有關? * YOLO 超參數部分討論 ![](https://i.imgur.com/dCKAAKz.png) ## 接下來方向建議 * 08-28 Joseph老師建議可以先找出中文字(不管是甚麼字),在場景中的Bounding Box位置 接下來的採用圖像辨識,辨識字是甚麼。 但這方法前提是文字定位要定的準,如果連都框不準辨識一定會有問題。 如何訓練調參數讓文字定位更準??? * 是否有相關模型是可以校正文字語意的? EX : input : 午肉麵 => output : 牛肉麵 input : 車專角 => output : 轉角 * 是否改成用分類模型做 ex.ResNet,因為YOLO部分有點問題且訓練成果不好 ## 老師回饋 * 信心值0.8太高了,調低一點到0.5,看是否可以辨識得到「一」 ### 會議錄影 https://youtu.be/zsvnUrTam9I https://youtu.be/OXuEeMyqwC0 **實驗成果:** 調低可以抓到的: ![](https://i.imgur.com/BtOKJO7.jpg) ![](https://i.imgur.com/nUji3FD.jpg) 還是找不到的 (可能設定訓練設定data Argment參數要加入旋轉?) ![](https://i.imgur.com/fDSIwv7.png) ![](https://i.imgur.com/zOcDLJw.jpg) ![](https://i.imgur.com/kBLcI8k.png) * 模擬資料先試試看訓練10個字,一次4808個太多了 **實驗成果:** ![](https://i.imgur.com/DvHYiBj.png) 測試結果沒問題 看起來可能是文字太多導致validation趨近0 ![](https://i.imgur.com/lS9FOCY.png) 直接圖片測試 未做黑白反轉 ![](https://i.imgur.com/UUs8iQv.png) 做黑白反轉 ![](https://i.imgur.com/Ylr6p6x.png) 應該是因為我們訓練的是白底黑字 所以導致這結果