这里是100张电动车图像数据集,还有400张在主页,都是jpg格式,可用于机器学习、神经网络、深度学习中训练模型,我是用Python的标注工具labelimg进行标注,再利用YOLOv5进行训练自己的模型。图像清晰度可观,
2025-03-29 15:53:14 217.72MB 神经网络 深度学习 数据集
1
豆瓣电影相关数据集!!!本数据集采集于豆瓣电影,电影与演员数据收集于2019年8月上旬,影评数据(用户、评分、评论)收集于2019年9月初,共945万数据,其中包含14万部电影,7万演员,63万用户,416万条电影评分,442万条影评,是当前国内互联网公开的电影数据集中最全的一份 数据集共有5个文件: movies.csv、person.csv、users.csv、comments.csv、ratings.csv 豆瓣电影数据集作为中国电影爱好者的聚集地,为广大用户提供了丰富的电影资料、用户评论、评分等信息,对于研究电影市场、用户偏好、影评文化和电影产业等方面具有重要价值。本数据集精选于豆瓣电影,特别集中在2019年8月上旬的电影与演员信息和2019年9月初的用户评分与评论,总计包含了多达945万条数据。 在该数据集中,电影信息的详细程度之高,覆盖面之广,囊括了14万部电影,这意味着几乎所有在豆瓣电影网站上有记录的电影都包括在内。对于电影行业研究者而言,这是一个无价的资源,可用于分析电影的流行趋势、导演作品分析、类型电影分布等。此外,数据集中还有7万名演员的信息,这不仅对影迷了解演员作品有帮助,也为研究演员的事业轨迹和表演特点提供了数据支持。 而针对影评方面,本数据集收录了416万条电影评分和442万条影评,其数量之庞大,使得研究者能够通过对这些数据的深入分析,了解用户的评分偏好,挖掘电影与观众之间的互动模式,甚至能够对特定电影或导演的粉丝群体进行画像分析。这不仅有助于电影的市场营销策略制定,也能够为电影的学术研究提供丰富的实证材料。 数据集的结构设计为5个部分,分别对应不同的信息模块: 1. movies.csv:包含了电影的基本信息,如电影名称、导演、上映年份、类型、时长等。这一部分的数据对于分析电影的基本属性和市场表现至关重要。 2. person.csv:收录了演员和导演等电影工作者的详细信息,包括其参与的电影作品、个人简介等。这部分资料对研究个人在电影产业中的影响和作用提供了丰富的信息源。 3. users.csv:包含了用户的基本信息,尽管为了保护隐私,用户的具体身份信息可能被隐去,但用户的行为数据,如关注电影、参与讨论等,依然能够反映一定的用户行为特征。 4. comments.csv:包含了用户的影评内容,这些评论可以按照时间顺序、电影、用户等级等多种维度进行分析。通过文本分析方法,可以提取出用户的观点、情感倾向等,具有很高的研究价值。 5. ratings.csv:记录了用户的评分信息,包括评分的具体数值和评分的用户。这些数据可用于分析用户对电影的评价标准,对电影的受欢迎程度和口碑传播有较为直观的体现。 整体而言,这份数据集不仅数量庞大,而且内容丰富,覆盖了电影、演员、用户和影评等多方面的信息,为电影数据分析提供了宝贵的资料库。通过对这些数据进行分析,研究人员和行业从业者可以洞察电影市场的多样性和复杂性,为电影产业的发展提供数据支持和决策依据。
2025-03-29 15:40:10 197.09MB 数据集
1
数据包包含中国北京、上海、深圳9个充电桩数据,原始文件包含桩位、时间、车辆状态、SOC(充电状态)、电流、电压、温度等信息,数据点以约18s为单位采样一年半,处理后的数据包含时间和充电功率,分辨率为18s和1h。 在当前社会发展背景下,随着新能源汽车行业的飞速发展,电动汽车充电站数据的重要性日益凸显。本数据包详细记录了中国一线城市北京、上海和深圳的九个充电桩的数据,涵盖了从桩位分布到电动汽车充电过程中的实时状态等多个维度。数据集详细记录了包括桩位、时间、车辆状态、SOC(充电状态)、电流、电压和温度等关键信息,是进行数据分析和机器学习的重要基础资源。 通过对这些数据进行分析,可以对充电站的使用情况、充电设备的性能表现以及电动汽车的充电行为等有一个全面的了解。例如,时间序列数据可以帮助我们了解充电站的高峰使用时段,从而优化充电站的电力调度和充电桩的布局规划。车辆状态和SOC数据则可以反映出电动汽车在不同时间点的充电需求和充电行为模式。此外,电流、电压和温度等数据对于评估充电设备的运行状况,预防潜在故障,保障充电安全具有重要意义。 原始数据文件以约每18秒为一个数据采样点,连续采集了一年半的时间序列数据。这种高频采样的原始数据对于研究充电站的短期运行模式和电动汽车的充电习惯具有较高的价值。处理后的数据则以18秒和1小时为分辨率,提供了时间和充电功率信息。高分辨率数据允许我们更细致地分析短时间内的变化趋势,而低分辨率数据则有助于捕捉长期的运行规律和模式。 这份数据集不仅可以用于对充电站日常运营的监测与管理,还能够被广泛应用于机器学习和大数据分析领域。例如,利用机器学习算法,可以从海量数据中识别出影响充电效率的关键因素,预测充电需求,优化充电站的运维策略,甚至可以为自动驾驶汽车的充电路径规划提供决策支持。此外,数据集还可以用来评估不同品牌和型号电动汽车的性能表现,为消费者提供更详尽的购车参考。 这份包含详尽信息的电动汽车充电站数据集,不仅为城市能源管理提供了有力的数据支持,也为新能源汽车行业的研究者和开发者提供了宝贵的实验材料,有助于推动整个行业的持续健康发展。
2025-03-29 15:29:02 248.96MB 数据集 机器学习
1
手工标注睡岗检测数据集是一套为机器学习模型,尤其是深度学习中的目标检测算法进行训练而准备的图像数据集。这个数据集包含1407张图像,图像内容围绕着睡岗这一特定场景进行采集和标注。具体来说,这些图像中的人或物体被标记为睡岗状态,这样的标注工作通常需要人工进行,因为自动化的算法难以准确捕捉到人类的睡岗行为。数据集的构建是为了让训练的模型能够识别和分析在监控视频或图像中出现的睡岗行为。 使用该数据集的目的主要是为了训练一种称为yolov7的物体检测模型。YOLO(You Only Look Once)是一种先进的实时目标检测系统,而yolov7作为该系列的最新版本,具备快速准确地识别和定位图像中多个物体的能力,尤其适用于安全监控、智能交通等领域。通过这种数据集的训练,yolov7模型能够提高在检测睡岗行为上的准确性和效率。 yolov7在训练过程中需要大量的带有标签的图像数据来学习和识别睡岗这一行为特征。数据集中的每张图片都需经过手工标注,标注的内容包括睡岗人员的位置、姿态以及睡岗的判定等关键信息。这些信息对于模型训练至关重要,因为它们为模型提供了学习的目标和反馈。 此外,此数据集可以被广泛应用于监控系统中,以提高安全性和效率,尤其在那些需要长时间监控人员行为的场合。例如,在工作场所可以监控工人是否在岗位上入睡,或者在交通控制中心可以检测工作人员是否在工作时间内出现疲劳驾驶的情况。 手工标注睡岗检测数据集是一个包含1407张经过精心标注的图像集,为训练高性能的yolov7模型提供了基础。通过使用这套数据集,可以提高模型在特定应用场景,如安全监控中,对睡岗行为的识别能力。这套数据集的应用不仅限于特定行业,它为各种监控系统提供了技术上的支持,有助于提前预防和减少因睡岗带来的各种安全风险。
2025-03-29 00:36:25 129.65MB 数据集
1
银行卡电信诈骗危险预测 一、包含以下实验: 使用机器学习算法(包含三个算法,分别为KNN、决策树、集成学习bagging),实现银行电信诈骗数据集实现二分类任务; 二、包含一个课程汇报PPT: 1、数据集介绍; 2、算法介绍; 3、实验步骤(包含数据分析探索+模型建立+融合模型); 4、实验结果及分析; 运行平台:jupyter; 二分类准确率(acc)都是99%以上,对于小白上手学习机器学习,是一个非常不错的练手项目;对于正在上数据分析、数据挖掘、机器学习课程的同学来说,这也是一个非常不错的汇报项目,可以直接拿里面的课程ppt进行汇报;
2025-03-28 17:30:57 80.05MB 机器学习 课程资源 数据集
1
样本图:blog.csdn.net/2403_88102872/article/details/144170814 文件太大放服务器下载,请务必到电脑端资源详情查看然后下载 数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2195 标注数量(xml文件个数):2195 标注数量(txt文件个数):2195 标注类别数:4 标注类别名称:["1to2day","2to4day","4to7day","7plusday"] 每个类别标注的框数: 1to2day 框数 = 559 2to4day 框数 = 619 4to7day 框数 = 509 7plusday 框数 = 520 总框数:2207 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注
2025-03-28 14:18:57 407B 数据集
1
使用2018年度部分大众点评的用户评价作为数据集,未筛选前共440万条评论数据,经过数据集的标签化处_Restaurant-evaluation-Emotion-classification_machine-learning-RNN-Bi-LSTM 在处理大数据和机器学习领域,对于文本数据集的分析和应用是关键的技术之一。2018年度部分大众点评的用户评价数据集,包含未筛选前的440万条评论,是一个极具研究和应用价值的资源。这个数据集能够为研究者提供丰富的文本信息,用以分析用户的消费行为、餐饮行业的发展趋势以及用户对餐馆的满意度等多维度信息。 利用该数据集进行标签化处理,即对每条评论进行情感分类,是一项挑战性的任务。情感分类旨在识别和提取文本中表达的情感倾向,如正面、中立或负面情绪。这一过程涉及到自然语言处理(NLP)技术的多项关键算法和模型。通过对评论进行情感分析,可以更直观地了解消费者的感受和评价,从而为餐饮业主提供改进服务、调整菜品或优化营销策略的重要参考。 在实现情感分类的过程中,机器学习技术起着核心作用。其中,递归神经网络(RNN)和其变体双向长短期记忆网络(Bi-LSTM)是处理序列数据的有效算法。RNN能够处理输入序列数据,记忆序列中的信息,而Bi-LSTM则能够同时考虑到序列的前向和后向上下文,更有效地捕获长距离依赖关系。这种模型特别适合处理语言这种具有复杂时间关联性的数据。 将这些技术应用于大众点评数据集的“Restaurant-evaluation-Emotion-classification_machine-learning-RNN-Bi-LSTM”项目中,可以构建出一个能够准确预测用户评论情感倾向的模型。通过这种方式,不仅能够为商家提供宝贵的数据支持,还能为消费者提供更为精准的推荐服务,从而在提高用户体验的同时,促进整个餐饮行业的良性发展。 此外,通过深入分析这些评论数据,还可以对不同地区、不同类型的餐馆进行比较,甚至可以对某个具体的餐馆做出更细致的评价分析。例如,研究者可以探究影响顾客满意度的关键因素,发现餐馆服务中的不足之处,或是分析哪些菜品更受欢迎等。这些分析不仅有助于餐馆的经营决策,也能够帮助消费者做出更加明智的选择。 通过对2018年度大众点评用户评价数据集的研究,不仅可以推动自然语言处理技术的发展,也能够促进餐饮行业服务品质的提升,同时为消费者提供更加个性化的消费体验。这一研究过程和结果的应用,充分体现了大数据分析在实际生活中的重要作用和价值。
2025-03-28 11:09:22 28.91MB
1
可用于故障诊断领域的论文写作与方法验证。 内置了轴承数据集,数据集原始论文,与两篇应用应用论文。 该数据包含在时变转速条件下从不同健康状况的轴承收集的振动信号。总共有36个数据集。对于每个数据集,有两个实验设置:轴承健康状况和变化速度条件。 可用于变转速工况条件下的轴承故障分类,对搭建的网络进行效果验证。
2025-03-28 00:18:01 467.56MB 毕业设计 数据集 发表论文
1
① 地震灾害评估及建筑结构特征数据集 ② 最新地震爆发数据集 (1990-02-03 至 2023-03-03) ③ 土耳其地震救灾推文数据集 ④ 阿联酋地震数据集 (2010 至 2023) ⑤ 新西兰地震数据集 ⑥ 日本地震数据集 (2019/1/1-2021/12/03) ⑦ 2023全球地震数据集 ⑧ 土耳其地震发数据集 (1910 至 2017) ⑨ 希腊地震数据集 (1965 至 2023 ) ⑩ 印度尼西亚地震数据集 11 全球地震数据集 (2001 年 1 月 1 日至 2023 年 1 月 1 日) 12 地震感知数据集 (那不勒斯地震事件的公众反应和情绪反应分析)
2025-03-27 18:56:07 172.14MB 数据集 地震数据 机器学习
1
标注方式上: RefCOCOg采用的是非交互式标注法,选定区域请人标注,再请另外一批人根据标注的expression选择对应的region; RefCOCO和RefCOCO+采用的是双人游戏 (Refer it game)的方式. 数据划分方式上: RefCOCO和RefCOCO+包含train, val, testA, testB。testA的图片包含多个人;testB的图片包含多个除人之外的物体。同一个图片的object-expression样本对要么全在训练集,要么全在验证\测试集。 RefCOCOg包含train, val, test。是按照object进行划分的,同一个图片的object-expression样本对集合可能会在训练集一部分,在验证\测试集另一部分。 图片选择上: RefCOCO:图像包含同一类别的多个物体。 RefCOCO+:图像包含同一类别的多个物体,并且expression不能有绝对位置(e.g., left)的词。 RefCOCOg:图像包含同一类别的2-4个物体,覆盖面积超过图片面积的5%
2025-03-27 04:15:38 54.09MB 数据集
1