python获取苹果手机短信验证码的代码 selenium python 获取验证码

转载

小鱼儿 2023-11-07 01:17:33

文章标签 selenium 验证码识别 selenium验证码识别验证码二值化 python 文章分类 Python 后端开发

工作中，如何用python和selenium提取验证码呢？

获取验证码的方法

按照以往的经验，有4种方法：

让开发帮忙去掉验证码代码，重新部署环境
弄个万能验证码，每次登陆都可以登陆
用cookie添加登录名和密码避开验证码的方式
老老实实获取验证码图片，识别出验证码

方法一：

遇到好说话的开发，他一般都能帮忙去掉验证码的代码。

但是代码去掉了，还需要重新部署一套没验证码的环境，麻烦，不推荐。

方法二：

还是需要开发的帮助，弄一个万能验证码，但测试环境弄的万能验证码可千万不能搞到正式环境。

故不推荐，还是先想想别的办法。

方法三：

该方法的难点是：如何在cookie中找到登陆用户名和密码的name，再将用户名和密码添加进去。

方法四：

最容易想到的办法，重点讲这个方法，此处有2个思路。

截图登陆页面，再截取验证码图片，识别；
直接在登陆页面，定位到验证码，将验证码图片另存为，识别；

该方法实现过程中，用到第三方库pytesseract，所以先安装需要引用的库。

python获取苹果手机短信验证码的代码 selenium python 获取验证码_selenium 验证码识别

pytesseract的安装

pytesseract依赖于tesseract，需要先安装tesseract。

安装Tesseract模块：

git文档地址：https://digi.bib.uni-mannheim.de/tesseract/

请安装不带dev的稳定版，下载后就是一个exe安装包，直接右击安装即可。

一般安装在默认路径，如果不在默认路径，请记住该路径。

下载培训数据：

需要下载相应的培训数据，直接下载整个zip文件，解压后将文件复制到’tessdata‘目录中。

一般为：C:Program Files (x86)Tesseract-OCRessdata

python获取苹果手机短信验证码的代码 selenium python 获取验证码_python_02

配置环境变量：

编辑系统变量里面 path，添加安装路径：C:Program Files (x86)Tesseract-OCR
添加TESSDATA_PREFIX变量，值为：C:Program Files (x86)Tesseract-OCRessdata
最后，在cmd命令模式下测试是否安装成功：
tesseract test.jpg text -l chi_sim

安装python的第三方库：　

pip install pillow #一个python的图像处理库，pytesseract依赖

pip install pytesseract

修改pytesseract.py文件：

找到pytesseract的安装包，C:Python34Libsite-packagespytesseract。

编辑pytesseract.py文件，该步骤必须做，不然编译时会报错。

修改内容如下：

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

python获取苹果手机短信验证码的代码 selenium python 获取验证码_python_03

代码实现

上面讲述了实现的2种思路，现在分别说明代码实现过程。

思路一：

先计算浏览器与登陆页面截图的比例值
再计算对应的验证码图片位置
再将获取到的验证码图片，先进行二值化处理
处理后的图像采用pytesseract库转化

python获取苹果手机短信验证码的代码 selenium python 获取验证码_selenium 验证码识别_04

截图保存验证码

python获取苹果手机短信验证码的代码 selenium python 获取验证码_selenium验证码识别_05

二值化处理验证码图片

python获取苹果手机短信验证码的代码 selenium python 获取验证码_二值化_06

验证码图片转化

上述图片转化过程中，注意参数设置。

不设置参数时，总是将1转化为7，设置后转化准确率杠杠滴。

当然，目前只是识别数字型的验证码，文字类型的方法应该是类似的。

思路二：

先定位到验证码的位置
将验证码图片另存到一个路径
该路径下获取最新的验证码图片
验证码图片二值化处理
处理后的图像采用pytesseract库转化

python获取苹果手机短信验证码的代码 selenium python 获取验证码_selenium验证码识别_07

验证码另存为图片

后面的图片处理和获取验证码过程与思路一相同。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：拦截器 axios 转发拦截器实现什么接口

下一篇：super关键字在Java中表示当前对象的直接父类对象 java中super是指当前对象的父类

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯