博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pytesseract使用的坑
阅读量:4537 次
发布时间:2019-06-08

本文共 824 字,大约阅读时间需要 2 分钟。

今天学了下python的OCR识别,其中遇到好多坑,下面就一一阐述是如何破解的,本人用的是Windows 64位,IDE是VS2017。

  • pip版本过低。

首先安装pytesseract这个库,pip install tessract。由于自己输错了,tessract前少了py两个字母,安装没有成功,抛出一个pip版本过低的问题,我就将pip升级到最新版9.0.3,以前是9.0.1。

输入python -m pip install --upgrade pip后提示没有访问权限,这里我就用管理员模式进到python目录下更新,这样就成功了。

  • 找不到指定文件

         在安装完pytessract后,还要去官网下载一个Tessract.exe文件安装配合使用。

        

        出现这个错误,想了一会儿没找到原因,搜了一下有说把要识别的图片放到pytessract的安装库下,试了一下没成功,而且个人认为这不是问题所在,因为把Image.open()的路径已经指定了也不行。

        另一个方法是:

         pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\Tesseract-OCR\tesseract'

         试了一下,成功了。仔细一想瞬间就明白了:官方给的是pytessract和Tessract.exe配合使用(Windows系统下),那么IDE怎么知道你这个CMD在哪个文件下,所以在使用时要手动声明你的pytessract需要哪个CMD来执行识别的工作,文件路径就是你Tessract的安装路径里tessract.exe的路径。

         最后说一点,Tessract这个识别率不高,4个字符识别出2个,还错一个。

              

 

 

 

       

转载于:https://www.cnblogs.com/xuanyishare/p/8677493.html

你可能感兴趣的文章
绕过阿里云防火墙继续扫描探测和SQL注入
查看>>
ln 软链接与硬链接
查看>>
JQuery ajax请求一直返回Error(parsererror)
查看>>
利用POI 技术动态替换word模板内容
查看>>
LeetCode No.168
查看>>
纪录jmeter loop controller 使用中的一个坑
查看>>
spring读取配置文件,且获取bean实例
查看>>
Xcode7 免证书真机测试
查看>>
史上最简单MySQL教程详解(基础篇)之数据类型
查看>>
802.11 帧封装细节
查看>>
WPF中Style文件的引用——使用xaml代码或者C#代码动态加载
查看>>
C#最佳工具集合:IDE、分析、自动化工具等
查看>>
把数字数值转换成单词形式
查看>>
Swift游戏实战-跑酷熊猫 14 熊猫打滚
查看>>
pdfjs预览pdf文件的两种方式(可复制)
查看>>
hdu1042N!
查看>>
UVA10010 - Where's Waldorf?
查看>>
Coder-Strike 2014 - Round 1(A~E)
查看>>
【BZOJ2739】—最远点(决策单调性+分治)
查看>>
shell 流程控制
查看>>