Python自定义数字识别
您可以使用此python脚本在自己的数字上应用一个简单的OCR。 我已经使用OpenCV预处理图像并从图片中提取数字。 使用K最近邻居(或SVM)作为模型-我使用自己的手写数据集对其进行了训练。 我还了免费MNIST数据集,因此您可以尝试不同的数据集如何使用不同的笔迹进行实验。
分析
我尝试仅使用提取的像素作为数据来训练和预测数字,但是即使在流行的分类算法(例如SVM,KNN和Neural Netoworks)上,准确性也太低。 尝试一些自定义阈值后,确实提高了精度。 仅将像素值转换为黑白图像后,我可以达到的最佳精度接近55-60%。
在搜索并阅读了有关从OCR图像中提取特征的信息之后,我偶然发现了 (梯度直方图)。 基本上,它尝试通过捕获有关梯度的信息来捕获区域中结构的形状。 图像梯度只是图像中像素之间的强度变化。
它通过将图像划分为较小的(通常为8x8像
1