首頁手記 pytesseract庫的安裝和使用

pytesseract庫的安裝和使用

標簽：

Python

在写爬虫的时候总是遇到一些以图片的形式展示的信息，因此要怎么解析图片上的信息呢？在Google上查了一下，需要安装pytesseract和pillow（我用的python3.7）和Tesseract-OCR

1. 安装pytesseract

　　pip insatll pytesseract

2. 安装pillow

　　pip install pillow

3. 安装Tesseract-OCR(https://github.com/tesseract-ocr/tesseract)

4. 安装完后将Tesseract-OCR的安装路径添加到环境变量中PATH和Path中都要添加

例如：

5. 在python的安装路径下的修改安装的pytesseract库里面的pytesseract.py，将默认的改成Tesseract-OCR的安装路径

7. 配置完了开始撸代码吧

运行后发现会报错

用Google查了一下，发现是因为验证码的图片模式为RGBA，是无法分配调色盘给透明通道的。更换为RGB模式则不会出现该问题。

对原先的代码修改一下，变为：

修改后就能正常使用了。

原文出处：https://www.cnblogs.com/Lvg3687/p/9611104.html

點擊查看更多內容

1人點贊

評論

共同學習，寫下你的評論

評論加載中...

作者其他優質文章

正在加載中

暮色呼如

手記

篇

粉絲

獲贊與收藏

311

關注作者，訂閱最新文章

閱讀免費教程

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

pytesseract庫的安裝和使用

閱讀免費教程