• 大小: 3.3MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-09-11
  • 语言: Python
  • 标签: python  ocr  

资源简介

上次下载了个pytesser_v0.0.1,它是 python2的,我给改成python3的.并且做成子目录下的模块吧。 这样不显得目录乱。 放在开发目录下就能用了 ocr。 import ocr.pytesser text= pytesser.image_file_to_string("code.jpg") 识别验证码什么的。 需要安装相应版本的 。 Pillow 或者 pip install Pillow. 因为要用到 PIL.images. 这个库底层是用的tesseract.exe 这里包含win32 win64 系统的二进制文件。在winxp32 win7 64测试通过。 由于要调用底层文件系统,读写图片,使用程序。所以当前目录和引用目录很重要。做了一些修改目录的工作。 需要在python3平台识别简单图片的拿去。

资源截图

代码片段和文件信息

“““Test for exceptions raised in the tesseract.exe logfile“““

class Tesser_General_Exception(Exception):
pass

class Tesser_Invalid_Filetype(Tesser_General_Exception):
pass

def check_for_errors(logfile = “tesseract.log“):
inf = open(logfile‘r‘)
text = inf.read()
inf.close()
# All error conditions result in “Error“ somewhere in logfile
if text.find(“Error“) != -1:
raise Tesser_General_Exception  ( text)

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件        433  2017-09-13 16:51  ocr\errors.py

     文件       1410  2007-05-04 20:30  ocr\fnord.tif

     文件      20607  2007-05-04 20:49  ocr\fonts_test.png

     文件      38668  2006-06-16 19:17  ocr\phototest.tif

     文件    1403536  2017-09-13 17:21  ocr\Pillow-4.0.0.win32-py3.4.exe

     文件       2753  2017-09-14 10:10  ocr\pytesser.py

     文件       2652  2007-05-06 00:37  ocr\README

     文件       2772  2006-06-17 01:18  ocr\tessdata\blackText.params

     文件       1012  2006-06-17 01:17  ocr\tessdata\configs\api_config

     文件        760  2006-06-17 01:17  ocr\tessdata\configs\api_resaljet

     文件        412  2006-06-30 20:56  ocr\tessdata\configs\box.train

     文件         97  2006-06-17 01:17  ocr\tessdata\configs\inter

     文件        815  2006-06-17 01:17  ocr\tessdata\configs\oldapi_config

     文件        816  2006-06-17 01:17  ocr\tessdata\configs\oldbox.train

     文件       1785  2006-06-17 01:17  ocr\tessdata\configs\variable_config

     文件       1068  2006-06-17 01:17  ocr\tessdata\configs\var_api_config

     文件       1071  2006-06-17 01:17  ocr\tessdata\configs\var_box.train

     文件         12  2006-06-17 01:17  ocr\tessdata\confsets

     文件        235  2007-01-18 02:08  ocr\tessdata\DangAmbigs

     文件     132988  2006-06-17 01:17  ocr\tessdata\fmtable.cls

     文件        751  2006-06-17 01:17  ocr\tessdata\fnetwts

     文件        720  2006-06-17 01:17  ocr\tessdata\freq-dawg

     文件     676716  2006-06-17 01:17  ocr\tessdata\inttemp

     文件    1369167  2006-06-17 01:17  ocr\tessdata\netwts

     文件        561  2006-06-17 01:17  ocr\tessdata\newdiff.asccodes

     文件      39772  2006-06-17 01:17  ocr\tessdata\normproto

     文件        548  2006-06-17 01:17  ocr\tessdata\pffmtable

     文件     198305  2006-06-17 01:17  ocr\tessdata\soptable.cls

     文件       2188  2006-12-28 02:27  ocr\tessdata\tessconfigs\batch

     文件       2251  2006-07-12 03:12  ocr\tessdata\tessconfigs\matdemo

............此处省略23个文件信息

评论

共有 条评论