--- tags: Table Detection --- # CascadeTabNet: An approach for end to end table detection and structure recognition from image-based documents [github](https://github.com/DevashishPrasad/CascadeTabNet) #### 路數很簡單 HRnet(high resolution net) + Cascade mask R-CNN ![](https://esgarden.esunbank.com.tw/personal/esb21788/Documents/%E6%96%B0%E8%B3%87%E6%96%99%E5%A4%BE/table_net.PNG) pipeline分為有框線表格和無框線表格分別做後處理 ![](https://esgarden.esunbank.com.tw/personal/esb21788/Documents/%E6%96%B0%E8%B3%87%E6%96%99%E5%A4%BE/table_net_pipeline.PNG) data sample: https://github.com/cndplab-founder/ICDAR2019_cTDaR/tree/master/samples/ground_truth_visualization 心得:table detection的時候會有偏移,cell detection做的不好 ### 有框線表格的解法 流程: 圖片 -> 表格線偵測 -> 表格線頃斜校正 -> OCR -> 表格結構解析+後處理 Unet表格線偵測 ![](https://esgarden.esunbank.com.tw/personal/esb21788/Documents/%E6%96%B0%E8%B3%87%E6%96%99%E5%A4%BE/unet.PNG) 參考資料: blog: https://mrxiao.net/hyper-table-ocr.html github: https://github.com/MrZilinXiao/Hyper-Table-OCR 騰訊做法: https://cloud.tencent.com/developer/article/1452973 心得:框有框表格的正確率還蠻高的,在匯款單或是扣繳憑單大部分的框線都有被標出來,但是重建表格的邏輯不太好,無法轉成漂亮的excel。額外有一個介面可以show各階段的成果XD