cnn_handwriting_chinese_recognition
使用python+flask构建的一个网站,然后从网页的写字到获取鼠标手写的汉字经过转码后传回后台,并通过图片裁剪处理之后再进行CNN手写中文识别的模型中进行识别,最后通过PIL将共有50,000多汉字,常用的有3,755个。这里主要对常见的3755个汉字进行识别。
一,数据集
例如:北京邮电大学模式识别实验室发布的数据(HCL2000) ,它是目前最大的脱机手写汉字库,共有1,000个人书写,除了汉字样本库外,还有一个对应的书写者信息库,记录了书写者的年龄,职业,文化程度等信息,用作研究相关影响因素。目前此数据库免费
1