该数据集包含通过慈善项目收集的超过40万个手写姓名。字符识别利用图像处理技术将扫描文档上的字符转换为数字形式。它通常在机器打印的字体中表现良好。然而,由于个人书写风格的巨大差异,对于机器识别手写字符仍然提出了艰巨的挑战。总共有206,799个姓氏和207,024个姓氏。数据分别分为训练集(331,059),测试集(41,382)和验证集(41,382)。
written_name_test_v2.csv
written_name_train_v2.csv
written_name_validation_v2.csv
test_v2.zip
validation_v2.zip
train_v2.zip
2021-07-28 16:41:34
1.2GB
数据集
1