车牌数据集(蓝、绿、黄、黑、白) 仅是车牌图片(未标注)9000左右
2026-03-29 23:12:35 76.15MB 数据集
1
1.本项目通过Google的Bert模型,基于Attention的大规模语料预训练模型,构建LSTM命名实体识别网络,设计一套问答系统通用处理逻辑,实现智能问答任务。 2.项目运行环境:Python环境和服务器环境。 3.项目包括5个模块:构造数据集、识别网络、命名实体纠错、检索问题类别、查询结果。数据是从北京邮电大学图书馆网站爬取,主要包含教师的电话、研究方向、性别,以及课程的学分、开设学期等信息;使用Google的Bert,调用LSTM模型代码,加以修改,进行训练;对识别到的课程实体进行纠错,依据所有课程全称,采用最短编辑距离匹配法与包含法相结合;通过识别到的实体类别和检索到的关键词进行问题分类。 4.项目博客: https://blog.csdn.net/qq_31136513/article/details/132665092
2026-03-29 18:28:58 365.05MB 自然语言处理 bert lstm 知识图谱
1
Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。
2026-03-29 14:05:22 5KB iris
1
打架检测数据集是一项用于目标检测的研究资源,其遵循了著名的Pascal VOC格式标准。该数据集包含了3146张jpg格式的图片,每张图片都对应一个xml格式的标注文件,用于标记图片中出现的目标。数据集的核心是区分两种状态:一种是“nofight”(无打架行为),另一种是“fight”(有打架行为)。在标注规则中,只有当两个人之间存在明显打架行为,且表现为肢体接触时,才将场景标注为“fight”。否则,所有其他情况都归类为“nofight”,并且对于非打架行为的数据集也必须进行标注,以减少模型在实际应用中的误检率。 该数据集的标注类别总数为2,具体标注类别名称分别为“nofight”和“fight”。对于这两个类别,标注的数量分别为“nofight count = 1288”和“fight count = 2170”。这意味着在3146张图片中,有1288张被标记为没有打架行为,而有2170张图片被标记为存在打架行为。因此,本数据集反映了打架检测场景的不平衡性,即打架行为相对更为常见。 在技术实施方面,此数据集可以应用于目标检测模型的训练,例如yolov5模型。未来自主研究中心已经使用此数据集对yolov5进行过训练,并验证了其效果,给出了相关的演示视频链接。用户可以通过观看这些演示视频来了解数据集的实际应用效果。 此外,数据集中还包含了关于如何使用labelImg这一标注工具的说明,它是一个被广泛使用的图像标注软件,能够生成用于训练机器学习模型的标签数据。数据集还提到了一些其它资源,例如labelme json转yolo工具、C#yolov10和yolov8的相关教程和实现,以及yolov9结合deepsort和pyqt5实现目标追踪的演示。这些资源的提及表明了该数据集的创建者鼓励研究者和开发者利用现有的工具和资源来增强或改进目标检测的性能。 值得一提的是,虽然数据集的创建者提供了图片和标注文件,但同时声明不对通过该数据集训练得到的模型或权重文件的精度作出任何保证。他们强调数据集仅提供准确且合理的标注。数据集的访问者应理解使用数据集的潜在风险,并确保使用时具备相应的知识和能力。为了更好的理解数据集的内容和使用方法,建议参考提供的视频演示和相关教程。 总结以上信息,打架检测数据集VOC格式3146张2类别是一个专业的、针对特定应用场景(打架行为检测)的目标检测数据集,它遵循Pascal VOC标准,提供了大量经过标注的图片资源。该数据集的发布是为了满足研究者和开发者对于高质量、预标注数据资源的需求,并且可以帮助他们更有效地开发和测试目标检测算法,尤其是在人像冲突检测场景下。同时,数据集作者提供了使用指南和相关工具信息,以助于用户更深入地理解和应用该资源。
2026-03-28 19:42:26 1.46MB 数据集
1
异常行为检测和跌倒检测是计算机视觉领域中的关键任务,主要应用于安全监控、智能家居、医疗健康等多个场景。这个数据集包含超过5000张图像和相应的5000多个标签,为研究者和开发者提供了丰富的素材来训练和测试算法模型。 在异常行为检测中,目标是识别出那些不寻常或非正常的活动,例如公共场所的盗窃、打斗或者交通违规等。这些行为通常在正常行为模式中并不常见,因此识别它们需要深度学习和机器学习技术。常用的方法包括使用卷积神经网络(CNNs)对视频帧进行分析,通过时间序列建模捕捉行为的变化。此外,还可以利用长短期记忆网络(LSTM)或门控循环单元(GRU)来处理序列数据,理解和识别连续的动作序列。 跌倒检测则专注于识别老年人或有特殊健康需求的人是否发生摔倒事件,这对于及时的救助和预防严重伤害至关重要。这一数据集可能包含各种场景下的跌倒情况,如不同角度、光照条件、动作姿势等。同样的,这里也会用到CNNs来分析单帧图像,同时结合运动信息,如光流估计或帧间差异,以判断是否存在跌倒行为。有时,为了提高准确率,还会引入人体关键点检测技术,定位人的关节位置,进一步分析人体姿态。 该数据集的5000多张图像代表了多样化的异常行为和跌倒情况,这有助于训练模型学习各种情况下的特征,并提升泛化能力。每张图片对应的标签则用于指导监督学习,标记图像中是否存在异常行为或跌倒事件,以及具体类型。在训练过程中,数据集通常会被划分为训练集、验证集和测试集,以评估模型在未见过的数据上的性能。 为了优化模型,可能需要进行数据增强,如翻转、缩放、裁剪等,以增加模型的鲁棒性。此外,还可以采用迁移学习策略,利用预训练的模型(如在ImageNet上训练的模型)作为初始权重,快速收敛并减少过拟合的风险。 评估模型性能时,除了准确率之外,还需要关注其他指标,如召回率、F1分数和平均精度均值(mAP),因为异常行为检测往往更注重减少漏报(假阴性)而不是误报(假阳性)。因此,一个平衡的阈值选择和对各类别性能的关注都是至关重要的。 这个数据集为研究异常行为检测和跌倒检测提供了宝贵的资源,可以帮助开发更准确、更可靠的监测系统,服务于公共安全和个人健康。通过深入学习和持续优化,我们可以期待这些技术在未来能够更好地服务于社会。
2026-03-28 19:37:58 290.11MB 数据集
1
样本图:blog.csdn.net/2403_88102872/article/details/144150029 文件太大放服务器下载,请务必到电脑端资源详情查看然后下载 数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):7970 标注数量(xml文件个数):7970 标注数量(txt文件个数):7970 标注类别数:10 标注类别名称:["Back","Front","FrontLeft","FrontRight","Laptop","Left","LookingDown","LookingUp","Phone","Right"] 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注
2026-03-28 13:57:07 407B 数据集
1
本篇文章所介绍的是一个专门为建筑物墙面贴瓷砖裂缝脱落缺陷检测所设计的数据集,格式为PascalVOC与YOLO。这个数据集包含144张jpg格式的图片,以及与之相对应的标注文件,其中包括VOC格式的xml文件和YOLO格式的txt文件。标注文件也一共有144个,分别对应每个图片的标注信息。 数据集中的图片分辨率统一为1024x1024,标注工具选用的是广泛使用的labelImg,标注规则为在图片上画矩形框以标记出缺陷位置。数据集共分为两类,分别是裂缝(crack)和脱落(spit),这两个类别的框数分别为184和317,总框数达到501。在图片数量上,裂缝类别占据了50张,脱落类别占据了116张。 需要特别指出的是,数据集并未预先划分好训练集、验证集和测试集,这一点需要使用者自己进行划分。此外,数据集的来源位于一个名为firc-dataset的github仓库中。标注类别名称在YOLO格式中并不与数据集中的顺序相对应,而是需要参照labels文件夹中的classes.txt文件。 需要注意的是,文章中还特别强调,这个数据集并不保证使用后训练出来的模型或权重文件的精度。文章中还提供了两张图片的预览,以及两张标注示例图片,方便使用者更直观地了解数据集内容。图片预览中的两张图片,分别展示了裂缝和脱落的实际情况,而标注示例图片,则清晰地展示了标注的矩形框如何界定裂缝和脱落区域。
2026-03-28 02:23:19 2KB
1
微软模拟飞行X1.5汉化合集包是一个针对微软经典飞行模拟游戏——"Microsoft Flight Simulator X"(简称FSX)的中文本地化资源包。这个合集包旨在为玩家提供一个更加符合中文语言习惯的游戏环境,使玩家在体验飞行乐趣的同时,能够更好地理解和操作游戏中的各种设置和功能。 微软模拟飞行X是一款高度真实的飞行模拟软件,它允许用户在全球范围内模拟驾驶各种类型的飞机,从小型私人飞机到大型客机,甚至包括军用飞机。游戏涵盖了广泛的飞行训练、任务和挑战,以及详尽的地理数据,提供了全球各地的真实景观。 汉化包.exe是这个合集包的主要组件,它包含了将原版英文游戏界面翻译成中文的所有必要文件。安装这个汉化包后,玩家可以理解游戏菜单、教程、帮助文档以及其他重要的游戏信息,使得游戏体验更加顺畅,尤其对于非英语背景的玩家来说,这是一个巨大的便利。 FSXChina FSX汉化补丁.exe可能是对原始汉化包的一个补充或更新,由FSXChina社区提供。这样的补丁通常会修复之前汉化中的错误,或者增加遗漏的翻译内容,确保玩家在游戏过程中不会遇到未翻译的英文文本。此外,社区补丁有时还会包含一些优化和改进,比如提高游戏性能或者增强用户体验。 密码.txt文件则可能包含了安装或解压汉化包时所需的密码。这通常是开发者为了防止非法传播或者保护内容不被滥用而设置的一种安全措施。玩家在使用这个合集包时,需要按照文件内的指示输入正确的密码,才能完成安装或解压缩过程。 微软模拟飞行X1.5汉化合集包是专为喜欢飞行模拟游戏的中文用户设计的,它通过汉化包和补丁,使得游戏的可读性和易用性大大提高。同时,密码的设置也保障了内容的安全性。如果你是一位热爱飞行模拟的玩家,这个汉化包无疑将极大地提升你的游戏体验。
2026-03-27 21:38:10 16.93MB 微软模拟飞行
1
拉姆萨尔湿地矢量数据集是地理信息系统(GIS)中的一个重要组成部分,它提供了关于全球拉姆萨尔湿地的详细信息。这些数据集通常由地理坐标定义的边界和中心点构成,以SHP(Shapefile)文件格式存储,这是一种广泛用于GIS领域的矢量数据格式。以下是对这些知识点的详细解释: 1. **拉姆萨尔湿地**:拉姆萨尔湿地是指根据《拉姆萨尔公约》(Ramsar Convention)认定的具有国际重要性的湿地。该公约于1971年在伊朗拉姆萨尔签订,目的是保护和合理利用湿地资源。拉姆萨尔湿地不仅包括湖泊、河流、沼泽等水体,还包括沿海和海洋湿地,对全球生物多样性和生态系统服务具有重要意义。 2. **湿地生态**:湿地是地球上生产力极高的生态系统之一,它们为动植物提供栖息地,是重要的水源地,具有净化水质、碳储存、防止洪涝、维护生物多样性等多种生态功能。研究湿地生态有助于我们理解湿地的动态变化及其对环境的影响,为湿地保护和可持续管理提供科学依据。 3. **矢量数据集**:矢量数据是一种地理信息的表示方式,它由点、线、面等几何对象组成,每个对象都有特定的位置和属性信息。矢量数据集可以精确地表示地物的边界和形状,适用于复杂地理特征的分析,如区域划分、缓冲区分析等。 4. **SHAPFILE文件**:SHAPFILE是ESRI公司开发的一种地理数据格式,常用于GIS领域。它由多个相关文件组成,包括.shp(几何数据)、.dbf(属性数据)、.shx(索引数据)等。SHP文件能够存储点、线、多边形等几何对象,且支持复杂的地理空间操作。 5. **数据下载与应用**:拉姆萨尔湿地矢量数据集的使用者可以通过下载features_published.zip和features_centroid_published.zip这两个压缩文件获取数据。解压后,可以导入到GIS软件如ArcGIS或QGIS中,进行数据分析、制图、空间查询等操作。例如,可以分析湿地的分布特征、比较不同年份的湿地变化、评估人类活动对其影响等。 6. **数据处理与分析**:在GIS软件中,可以对拉姆萨尔湿地矢量数据进行多种处理,如叠加分析(与其他地图数据融合),缓冲区分析(确定湿地周边一定距离内的影响区域),网络分析(研究湿地间的连通性),以及统计分析(计算湿地面积、物种丰富度等)。 7. **数据共享与发布**:这些数据集的发布意味着全球的研究者、政策制定者和公众都可以访问到这些信息,从而促进湿地保护的国际合作和信息透明度。通过在线平台或数据仓库,可以实现数据的快速分享和传播,提高湿地保护的效率和效果。 拉姆萨尔湿地矢量数据集是地理学、生态学、环境科学等领域的重要研究工具,它能帮助我们更好地理解和保护这些珍贵的自然遗产。通过GIS技术,我们可以深入挖掘这些数据,揭示湿地的分布模式、变化趋势,为湿地管理和决策提供科学支持。
2026-03-27 15:46:21 87.81MB
1
数据集-目标检测系列- 短裤 检测数据集 shorts >> DataBall 标注文件格式:xml​​ 项目地址:https://github.com/XIAN-HHappy/ultralytics-yolo-webui 通过webui 方式对ultralytics 的 detect 检测任务 进行: 1)数据预处理, 2)模型训练, 3)模型推理。 脚本运行方式: * 运行脚本: python webui_det.py or run_det.bat 根据readme.md步骤进行操作。 目前数据集暂时在该网址进行更新: https://blog.csdn.net/weixin_42140236/article/details/142447120?spm=1001.2014.3001.5501
2026-03-27 15:28:39 3.83MB yolo python 目标检测
1