验证码技术是确保网站安全性和用户信息隐私性的第一道保障。针对多样化的验证码,其识别技术也很多,传统验证码技术主要分为人工识别、字典模型识别和验证码图像分割识别,其中字典模型中较为典型的Tesseract-OCR,其识别率相对较低,过程操作复杂,需要对识别错误的文字做出修改不适合对复杂验证码做出高效迅速的识别。本文使用TensorFlow框架实现卷积神经网络算法对验证码进行识别,利用Captcha包下提供的ImageCaptcha()方法生成模拟现实网站的验证码,利用卷积神经网络对生成的验证码进行训练生成训练模型,通过训练模型进行对测试集的测试得到识别率,识别率可达到97%以上远超传统验证码识别算法。
1