上传者: 38729022
|
上传时间: 2023-01-11 06:36:58
|
文件大小: 62KB
|
文件类型: PDF
本文主要利用tesseract识别网页登陆中的验证码(从图像的角度,不是Cookie)
很多人对CAPTCHA(验证码)很熟悉,但是很少有人知道其含义:全自动区分计算机和人类的图灵测试。通俗的讲就是是一种区分人和人工智能程序的方法。很多的网页都设置了验证码,常见的就是由“字母数字”组成的图片,如下:
本文的代码是利用selenium模拟浏览器的运行,识别登陆界面的验证码,分割验证码的区域然后识别验证码(光学字符识别)。
# -*- coding: utf-8 -*-
"""
Created on Sun Apr 26 17:42:23 2020
@author: dell
"""
impor