手写汉字数据集HWDB1.1文件转换代码-GNT2PNG,更多的内容请参见我的博客,里面有详细的介绍
2021-07-27 14:02:10 2KB 手写汉字识别 HWDB
1
本数据集包括3273类汉字,共47万张汉字图片,解压后,每类汉字归类在一个文件夹下,各图像尺寸不一,包含在自然场景下能见到的各种字体。本人由于需要大量的自然场景中文汉字数据集,因此从各处搜来大量标注的自然场景图片数据集,处理之后得到汉字数据集。使用这些汉字数据集训练后,在我自己的项目数据上也能识别很好。
2021-03-12 12:35:02 196.09MB 汉字;自然场景;
1
此数据集为自然场景下的特定场景下的汉字数据集,即,不包含自然场景下的手写体、过度扭曲图、以及艺术体,可以参考道路交通路标上的规范字体,数据集解压后,此数据集包含2602类汉字,32万张汉字图片,里面包括黑体白字以及白体黑字,以适应不同的字体,而非清一色的白体黑字或者黑体白字。
2020-03-04 03:13:25 94.41MB 汉字 数据集
1
此数据集是3755个常用的汉字。第个汉字包含20种不同的样式。 20种同一汉字放在一个文件夹内,文件夹名称以数字命名。 测试集每个汉字包含6种字体。 百分百好用的数据,象征收5积分。 文件有358M不能够一起上传,test放到了百度云上,在说明文件中可以找到下载地址。 如何通过文件夹名称找到相应编码: 1、从chinese_labels读取 p42 sI42 V\u4e4d 其中: 42是train或test对应的文件夹名称 \u4e4d是Unicode码,注带有\ 2、从汉字Unicode互转得到转换的URL地址 把\u4e4d复制到转换框中->单击Unicode转中文汉字
2020-02-03 03:02:57 214.1MB 汉字 单字 汉字数据 汉字数据集
1
手写汉字数据集(HWDB1.1),图片形式的各种汉字以经分别在各个文件夹内存储好。
2019-12-21 20:36:57 42.43MB 手写汉字 数据集
1
压缩包包含了gnt2png.py alz压缩包解压软件,以及HWDB解压数据集解压完成的PNG文件的下载地址。
2019-12-21 19:44:32 9.7MB 手写汉字识别 工具
1