
需要安装tesseract工具,和pytesseract的python包,pytesseract是google的tesseract的一个python版本的接口库。
把网页中的验证码图片爬取下来之后,稍微修改一下对比度增加识别的准确率,然后用pytesseract直接识别。
import requests
from lxml import etree
from PIL import Image
from io import BytesIO
import pytesseract
url = "https://xxxx/login.html"
res = requests.get(url).content.decode("utf-8")
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)