五类表格文本标注数据,应用于表格识别,OCR等领域。 基本说明: 1. 总共4000张标注数据以及1000张未标注数据; 2. 数据标注采用labelme,保存文件为json; 3. 标注的数据类别为横线与竖线; 4. 表格中的虚线以及无线区域也会框选出来(这个标注信息,花点心思也能够明白模型的设计思路) 5.数据来源于真实数据,涉及到机密信息已脱敏 6. 这么大的数据集,来之不易,给需要的工程人员以及学习者提供些数据 7. 数据标注也雇佣了一些标注人员,标明的价格就当是会点小本吧。 8. 如果有需要可以下载,另外本人上传的资源还有目标检测-厨房老鼠的数据集,以及OCR手写数据集,都是非开源数据集,有需要可以查找。 9. 感谢各位大佬们,如果觉得数据集有价值,可以留个言评论一番哦。 最后最后,数据来源真实,已用于落地模型的训练,无需担心是脏数据。
2022-07-12 12:07:24 262.89MB 表格识别 OCR 真实数据 深度学习
训练MTCNN人脸数据集
2022-02-24 21:22:41 610.72MB 人脸识别 深度学习
1
Praat 音频分析 人工标注-附件资源
2021-12-22 16:33:08 106B
1
PLabel 半自动标注系统是基于BS架构,纯Web页面操作,由鹏城实验室叶齐祥、曾炜、田永鸿教授团队自主研发,由工程师邹安平维护,集成视频抽帧,目标检测、视频跟踪、ReID分类、人脸检测等算法,实现了对图像,视频的自动标注,并可以对自动算法的结果进行人工标注,最终得到标注结果,同时也可以对视频、图片、医疗(包括dicom文件及病理图像)相关的数据进行人工标注,标注结果支持COCO及VOC格式。支持多人协同标注。 半自动标注系统主要功能有:用户管理,数据集管理,自动标注,人工标注,ReID标注,车流统计,视频标注,医疗CT标注,超大图像标注,模型管理与重训,报表管理。数据标注过程一个非常重要的因素是数据安全,在标注使用中防止数据泄露,采用基于web标注工具是有效避免数据泄露的措施之一。 半自动标注系统以保证性能的情况下最小化人工标注代价为目标,不断提升自动标注效率,减少人工标注和人工参与过
2021-12-13 16:19:52 434.18MB JavaScript
1
在做一个图像语义分割的项目,得处理大量采集的图片数据,很多图片背景和前景难以区分,只有人工交互标注,所以编写了一个简单的交互标注软件。只能标注两类,可以撤销10次,可以设置工作半径和颜色阈值,用了简单的颜色距离判断,对于块分区明显的图片比较容易标注,当然你可以在我的基础上更改代码,使用区域生长法等其他方法。软件使用方法看这:https://blog.csdn.net/macunshi/article/details/86549699
2021-07-21 17:02:20 5.3MB 图像分割 标签制作 人工标注
1