上传者: 38565221
|
上传时间: 2022-01-15 10:49:53
|
文件大小: 122KB
|
文件类型: -
最近在折腾验证码识别。最终的脚本的识别率在92%左右,9000张验证码大概能识别出八千三四百张左右。好吧,其实是验证码太简单。下面就是要识别的验证码。
我主要用的是Python中的PIL库。
首先进行二值化处理。由于图片中的噪点颜色比较浅,所以可以设定一个阈值直接过滤掉。这里我设置的阈值是150,像素大于150的赋值为1,小于的赋为0.
def set_table(a):
table = []
for i in range(256):
if i < a:
table.append(0)
else:
table.append(1)
ret