# 中文場景辨識 - OCR [tesseract 教學筆記](https://ithelp.ithome.com.tw/articles/10227263) !! 安裝時記得要多勾選 chi_tradition 的語言 !! ===> 這個套件的效果很差 :((( --- 官方提供之 [繁體中文單字識別](/J_39aiDpRLOAdULB2zJGmw) 教學 ===> 目前打算以此版本進行 OCR 測試,原版是 102 字進行訓練,預計以此版本的架構進行訓練。 但是,原版本的字數太少,只有 102 個字,代表只能偵測這 102 個字,所以我有個大膽的想法:**收集大量的中文字,硬 train 一發!** 這裡收集的中文字是從官方提供的 train 資料夾內的 JSON 檔下去撈字,收集到的中文+英文(大小寫)+數字總共 3596 個字元,產生完成的 txt 檔與 Python 檔會放置於雲端內。 ###### tags: `T-Brain`
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up