# Tesseract OCRでどこまでやれるか試してみた 以下をコマンドプロンプトで実行 ※jpgでもpngでもどっちでもOK ※下記だとドキュメントファイルに元画像を置く C:\Users\xxxxxxxxxx\Documents>"C:\Program Files\Tesseract-OCR\tesseract.exe" 202604.jpg test -l jpn 参考 Tesseract OCR をWindowsにインストールする方法 https://gammasoft.jp/blog/tesseract-ocr-install-on-windows/ RaspberryPi3 に tesseract をインストールして「画像から文字の読み取り」(OCR)を試す http://min117.hatenablog.com/entry/2019/06/04/233931 Windows環境でのtesseract-ocrの導入とOCR環境の構築(パス通さなくてもいけた) https://qiita.com/ReplyToCC/items/238ce08977be60e4b950 ## 1. Webをスクショしてみた ![](https://i.imgur.com/01S1RFS.jpg) ### 結果 何となくいけてる。 ![](https://i.imgur.com/CQXB6bG.jpg) ## 2. 手書き文字(mnist)で試してみた ![](https://i.imgur.com/vYs5pMO.jpg) ### 結果 全然ダメ。 ![](https://i.imgur.com/te9DunC.jpg) ## 3. PCで入力した数字(メモ帳)をスクショして試してみた ![](https://i.imgur.com/PkCCqFD.jpg) ### 結果 いける。 ![](https://i.imgur.com/78yoity.jpg) ## 3. PC文字の印刷物をカメラで撮って試してみた ![](https://i.imgur.com/U2wjeZ6.jpg) ### 結果 カオス。 ![](https://i.imgur.com/QjioqR6.jpg) ## 結論 ・PC画面に映っているものならいけそう ・手書きはダメ ・実世界に召喚されたものはキツイ ## 未来 下記のブログで頑張っている(けど手書きは厳しそう) Pythonで画像の手書き数字を認識(OCR / Google Cloud Vision API) https://qiita.com/yoshi_yast/items/bd5e1e91ac9f64157203 【Python編】OCRプログラミング:日本語の手書き文字認識(Tesseract OCR) https://child-programmer.com/ai/ocr/python/tegaki-japanese/