Python3使⽤pytesseract进⾏图⽚识别
⼀、安装Tesseract-OCR软件
参考我的前⼀篇⽂章:
⼆、Python中使⽤
1. 安装依赖
1 pip install pytesseract2 pip install pillow
2. 编写代码
准备识别下⾯这个验证码:代码如下:
1 import pytesseract2 from PIL import Image3
4 image = Image.open(\"code.png\")
5 code = pytesseract.image_to_string(image)6 print(code)
结果为6067,识别成功。
3. 如果出现错误,⼀般是系统变量设置的问题:
解决办法⼀:根据安装Tesseract软件的步骤,设置好即可。解决⽅法⼆:在代码中添加相关变量参数:
1 import pytesseract2 from PIL import Image3
4 pytesseract.pytesseract.tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'5 tessdata_dir_config = '--tessdata-dir \"D:/Program Files (x86)/Tesseract-OCR/tessdata\"'6
7 image = Image.open(\"code.png\")
8 code = pytesseract.image_to_string(image, config=tessdata_dir_config)9 print(code)
--------------------------------------------------------------------------------------------------------------------talk is cheap , show me the code.