《90+深度学习数据集》是一份详尽的深度学习资源指南,汇总了超过90个面向不同应用领域的开源数据集。这份指南覆盖了小目标检测、目标检测、工业缺陷检测、人脸识别、姿态估计、图像分割及图像识别等多个热门研究方向。通过精心整理的数据集链接和简要描述,它为研究人员和开发者提供了宝贵的资源,助力他们在深度学习领域进行更深入的研究和应用开发。 在小目标检测方面,该指南收录了如AI-TOD航空图像数据集、iSAID航空图像大规模数据集等,这些数据集包含大量高分辨率图像和密集标注的对象实例,特别适合处理航拍图像中的小目标检测任务。此外,还介绍了TinyPerson、DeepScores等针对特定小物体识别的数据集,为相关领域的研究提供了有力支持。 在目标检测领域,COCO2017、DOTA航拍图像数据集等经典数据集被收录其中,这些数据集不仅规模庞大,而且标注精细,适用于开发和评估各种目标检测算法。同时,指南还涵盖了工业检测数据集,如坑洼检测数据集、天池铝型材表面缺陷数据集等,为工业质检自动化提供了丰富的数据资源。
2025-03-06 16:13:13 681KB 深度学习 数据集
1
大模型微调自我认知数据集
2025-02-25 22:59:02 20KB 数据集 自我认知 python 模型微调
1
RandPerson数据集是由MakeHuman和Unity3D生成的。这是第一个合成人的再识别数据集,其设置类似于真实的视频监控系统,即有一个摄像头网络和多个人同时移动。该数据集包含1,801,816张合成的人物图像,共有8,000个身份。该数据集中的图像通常包含不同的视角、姿势、照明、背景、遮挡和分辨率。
2025-02-21 10:28:37 14.18MB 数据集 行人重识别
1
中文股票评论文本训练数据集
2025-02-03 13:26:29 1.08MB 数据集
1
【数据集】[dataset] 图片包括采砂船图片共160张,训练集112张、验证集32张、测试集16张。压缩包包括图片和标注文件,标注文件 包括coco/yolo。图像类别包括夜间、白天,各种样式的船。数据集均为手工标注,保证了标注精确性。详情可查看:https://blog.csdn.net/lucentlc/article/details/144291391
2025-01-30 01:21:57 9.71MB 数据集
1
该数据集来自 OpenCellid - 世界上最大的蜂窝信号塔的开放数据库。 截至 2021 年,它拥有超过 4000 万条关于全球蜂窝信号塔(GSM、LTE、UMTS 等)的记录及其地理坐标和元数据(国家代码、网络等)。 OpenCelliD 项目在 Creative Commons Attribution-ShareAlike 4.0 International License 协议下许可使用,我们根据相同许可条款重新分发此数据集的快照。登录后即可下载最新版本的数据集。
2025-01-11 16:14:33 695.36MB 网络 数据集 大数据分析
1
数据集-目标检测系列- 消防车 检测数据集 fire_truck >> DataBall 标注文件格式:xml​​ 项目地址:https://github.com/XIAN-HHappy/ultralytics-yolo-webui 通过webui 方式对ultralytics 的 detect 检测任务 进行: 1)数据预处理, 2)模型训练, 3)模型推理。 脚本运行方式: * 运行脚本: python webui_det.py or run_det.bat 根据readme.md步骤进行操作。 目前数据集暂时在该网址进行更新: https://blog.csdn.net/weixin_42140236/article/details/142447120?spm=1001.2014.3001.5501
2025-01-07 15:52:37 7.04MB yolo 目标检测 python 计算机视觉
1
"快递包裹YOLO训练数据集"指的是一个专门针对快递包裹识别的深度学习模型训练数据集。YOLO(You Only Look Once)是一种实时目标检测系统,它在计算机视觉领域广泛应用,尤其在物体识别方面表现出色。这个数据集是在COCO(Common Objects in Context)数据集的基础上进行了扩展和定制,以适应快递包裹的特定识别需求。 COCO数据集是一个广泛使用的多类别物体检测、分割和关键点定位的数据集,包含大量的图像和详细的注解,涉及80个不同的物体类别。而"快递包裹YOLO训练数据集"则更专注于快递包裹这一单一对象,这意味着它可能包含了大量不同形状、大小、颜色和背景的包裹图像,以确保模型能够处理各种实际场景中的包裹检测任务。 中提到的"已经打好YOLO格式的标签"意味着每个图像都配有一份YOLO的标注文件。YOLO的标签格式是每行包含四个部分:边界框的中心坐标(x, y),边界框的宽度和高度(w, h),以及该边界框内物体的类别概率。这种格式使得数据可以直接用于训练YOLO模型,无需进行额外的预处理。 "数据集 包裹YOLO数据集集 深度学习"进一步强调了这个资源的关键特征。数据集是深度学习模型训练的基础,特别是对于目标检测任务,高质量、丰富多样且标注准确的数据至关重要。包裹YOLO数据集集意味着这是一个专门针对包裹检测定制的集合,可以为开发者提供训练和优化YOLO模型的材料。深度学习是实现这一目标的核心技术,通过神经网络模型学习包裹的特征,从而实现高精度的检测。 在【压缩包子文件的文件名称列表】"train80"中,我们可以推测这可能是训练集的一部分,包含80个子文件或者80类包裹的样本。通常,训练集用于模型的学习,它将教会模型如何识别包裹,并通过不断的调整权重来优化性能。在实际应用中,还会有一个验证集和测试集用于评估模型的泛化能力和避免过拟合。 "快递包裹YOLO训练数据集"是一个专门为快递包裹目标检测设计的深度学习训练资源。它基于COCO数据集并进行了针对性的增强,提供了符合YOLO模型训练要求的标注,是开发高效包裹检测系统的理想起点。使用这个数据集,开发者可以训练出能够在物流自动化、无人配送等领域发挥重要作用的模型。
2025-01-04 12:19:00 219.95MB 数据集 深度学习
1
数据集nCoV_100k.labled.csv包含10万条用户标注的微博数据,包括微博id,发布时间,发布人账号,中文内容,微博图片,微博视频,情感倾向等多条数据,具体格式如下: 微博id,格式为整型。 微博发布时间,格式为xx月xx日 xx:xx。 发布人账号,格式为字符串。 微博中文内容,格式为字符串。 微博图片,格式为url超链接,[]代表不含图片。 微博视频,格式为url超链接,[]代表不含视频。 情感倾向,取值为{1,0,-1}。
2024-12-28 15:40:07 42.64MB 数据集
1
文本情感分析是自然语言处理(NLP)领域的一个重要任务,其主要目标是识别和提取文本中的主观信息,包括情绪极性(如正面、负面或中性)、情绪强度以及特定情感类别(如喜悦、愤怒、恐惧等)。在这个“文本情感分析(含比赛7个数据集).zip”压缩包中,包含了多个用于训练和测试情感分析模型的数据集,这些数据集通常由真实的用户评论、社交媒体帖子或其他类型的文本组成。 我们要了解PaddleNLP库。PaddlePaddle是由百度开发的深度学习框架,而PaddleNLP是该框架下专门针对NLP任务的工具包,它提供了丰富的预训练模型、数据集、以及易于使用的API,使得开发者能够快速搭建和训练情感分析模型。 在压缩包内的"paddlenlp_sentiment-main"文件夹中,可能包含以下内容: 1. 数据集:每个数据集通常分为训练集(train)、验证集(validation)和测试集(test),用于模型的训练、调优和评估。数据集的格式通常是CSV或JSON,每行代表一条文本数据,包括文本内容和对应的情感标签。 2. 预处理脚本:为了输入到模型中,原始文本需要进行预处理,包括分词、去除停用词、词干提取等。预处理脚本可能使用Python的Jieba库进行中文分词,或者使用其他NLP工具。 3. 模型定义:可能包含基于Transformer、LSTM、BERT等的模型代码,用于构建情感分析任务的神经网络结构。 4. 训练脚本:指导如何使用PaddleNLP来加载数据、配置模型参数、训练模型并保存模型权重。 5. 评估脚本:用于在测试集上评估模型性能,常见的指标有准确率、精确率、召回率和F1分数。 6. 示例代码:展示如何使用训练好的模型对新文本进行情感分析预测。 在实际应用中,情感分析有多种应用场景,例如在线客服评价分析、产品评论情感挖掘、舆情监控等。通过训练情感分析模型,可以自动化地理解大量文本数据的情绪倾向,为企业决策提供数据支持。 对于初学者,可以从以下几个步骤入手: 1. 安装PaddlePaddle和PaddleNLP。 2. 熟悉提供的数据集,了解其格式和内容。 3. 使用预处理脚本处理数据,生成模型可以接受的输入格式。 4. 选择或构建一个适合情感分析的模型,并设置合适的超参数。 5. 在训练集上训练模型,通过验证集调整模型性能。 6. 在测试集上评估模型的泛化能力,如果效果满意,可以将模型部署到实际应用中。 通过这个压缩包,你可以深入学习和实践文本情感分析,同时提升对PaddleNLP框架的理解和使用技巧。记得在实验过程中,不断地调整和优化模型,以达到最佳的情感分析效果。
2024-12-28 14:31:30 51KB
1