# 中文場景辨識 - OCR [tesseract 教學筆記](https://ithelp.ithome.com.tw/articles/10227263) !! 安裝時記得要多勾選 chi_tradition 的語言 !! ===> 這個套件的效果很差 :((( --- 官方提供之 [繁體中文單字識別](/J_39aiDpRLOAdULB2zJGmw) 教學 ===> 目前打算以此版本進行 OCR 測試,原版是 102 字進行訓練,預計以此版本的架構進行訓練。 但是,原版本的字數太少,只有 102 個字,代表只能偵測這 102 個字,所以我有個大膽的想法:**收集大量的中文字,硬 train 一發!** 這裡收集的中文字是從官方提供的 train 資料夾內的 JSON 檔下去撈字,收集到的中文+英文(大小寫)+數字總共 3596 個字元,產生完成的 txt 檔與 Python 檔會放置於雲端內。 ###### tags: `T-Brain`
×
Sign in
Email
Password
Forgot password
or
Sign in via Google
Sign in via Facebook
Sign in via X(Twitter)
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
Continue with a different method
New to HackMD?
Sign up
By signing in, you agree to our
terms of service
.