机器学习数据集
2026-03-04 16:16:03 3.49MB 机器学习 数据集
1
手游在当下的日常娱乐中占据着主导性地位,成为人们生活中放松身心的一种有效途径。近年来,各种类型的手游,尤其是闯关类的休闲手游,由于其对碎片化时间的利用取得了非常广泛的市场。然而在此类手游中,新用户流失是一个非常严峻的问题,有相当多的新用户在短暂尝试后会选择放弃,而如果能在用户还没有完全卸载游戏的时候针对流失可能性较大的用户施以干预(例如奖励道具、暖心短信),就可能挽回用户从而提升游戏的活跃度和公司的潜在收益,因此用户的流失预测成为一个重要且挑战性的问题。在毕业项目中我们将从真实游戏中非结构化的日志数据出发,构建用户流失预测模型,综合已有知识设计适合的算法解决实际问题。 二、作业说明 根据给出的实际数据(包括用户游玩历史,关卡特征等),预测测试集中的用户是否为流失用户(二分类); 方法不限,使用百度云进行评测,评价指标使用 AUC; 提交代码与实验报告,报告展示对数据的观察、分析、最后的解决方案以及不同尝试的对比等; 最终评分会参考达到的效果以及对所尝试方法的分析。
2026-03-04 14:41:55 20.98MB 数据集 机器学习
1
样本图:blog.csdn.net/FL1623863129/article/details/144446513 文件放服务器下载,请务必到电脑端资源预览或者资源详情查看然后下载 数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):2648 标注数量(json文件个数):2648 标注类别数:1 标注类别名称:["road"] 每个类别标注的框数: road count = 2782 使用标注工具:labelme=5.5.0 标注规则:对类别进行画多边形框polygon 重要说明:可以将数据集用labelme打开编辑,json数据集需自己转成mask或者yolo格式或者coco格式作语义分割或者实例分割 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注
2026-03-04 12:02:00 407B 数据集
1
贷款审批是金融机构在发放贷款前,对借款人及其申请进行的评估和审核过程。此数据集专门用于根据个人申请人详细信息、财务指标和贷款特定因素预测贷款审批结果。它包含 12 列的 32,581 个条目,提供影响贷款审批决策的多种功能。其中数据包含:申请人的年龄(以岁为单位)(person_age)、申请人的美元年收入(person_income)、房屋所有权状况(例如,租住、拥有、抵押贷款)(person_home_ownership)、工作年限(person_emp_length)、贷款目的(例如,教育、医疗、个人)(loan_intent)、分配给贷款的风险等级(loan_grade)、申请人申请的贷款总额(loan_amnt)、与贷款相关的利率(loan_int_rate)、贷款的审批状态(已批准或未获批准)(loan_status)、申请人收入中用于偿还贷款的百分比(loan_percent_income)、指示申请人是否有违约历史记录(cb_person_default_on_file)、申请人的信用记录长度(以年为单位)(cb_person_cred_hist_length)。
2026-03-04 09:47:54 392KB 数据集
1
工业零部件数据集13种2100张图片 0:"双六角柱" 1:"法兰螺母" 2:"六角螺母" 3:"六角柱" 4:"六角螺丝" 5:"六角钢柱" 6:"水平仪" 7:"垫片" 8:"塑料缓冲柱" 9:"矩形螺母" 10:"圆头螺丝" 11:"弹簧垫圈" 12:"T型螺丝"
2026-03-04 09:39:01 109.54MB 目标检测 深度学习
1
数据集内容: 品牌 店铺名称 分店名称 店铺地址】 电话 城市 区域 商圈 大类 品类 细分 评分 人均 点评数 口味/划算/视效/交通/造型/款式/菜品/月子餐/趣味/剧本/片源/机器/书籍/专业/技术/款式设计/颜色款式 效果/质量/音效/产品/车况/效率/布置/摄影/设施配置/水质/设施/设计/性价比/做工品质 环境/准点/施工/守时/速度/餐饮/策划/做工工艺 服务/态度/阿姨/配套/课程/护理/场地/环保材质/安装服务 师资/技师/主持人/项目/主持人/房间/教练 店铺链接 推荐菜 推荐菜 推荐菜 小分 可用于数据分析,机器学习,可视化等领域研究
2026-03-04 09:23:30 2.4MB 数据集 销售数据 可视化数据
1
具体标签体系如下:Label 1 对应大隐静脉主干及双大隐静脉结构,其边界被精确勾勒;Label 2 涵盖大隐静脉侧支、浅筋膜小血管及穿静脉浅层血管;Label 3 包括深静脉、动脉、 穿静脉深层血管及肌间静脉。 针对 Label 2 与 Label 3,考虑到其非本研究的核心靶血管,且超声图像受物理特性及操作者主观性影响常出现模糊与干扰,采用模糊标注策略以平衡标注效率与模型泛化需求。 最终共标注关键帧 2246 张,形成结构化的多类别标注数据集。
2026-03-03 19:06:22 99.08MB 图像分割 三维重建
1
在当今的信息时代,随着科技的不断进步,智能穿戴设备和健康监测系统已经广泛地应用于人们的生活之中。这些设备和系统通过各种传感器收集用户的身体数据,从而实现对用户健康状况和行为模式的实时监控。其中,多传感器数据融合技术作为核心环节,对于提升设备的智能分析能力和准确性具有重要作用。 在机器学习领域,多传感器数据融合技术结合了来自不同传感器的信号,例如加速度计和陀螺仪,以此获得更准确和全面的信息。加速度计能够测量物体在空间中的线性加速度,而陀螺仪则可以测量角速度,两者相结合能够提供关于物体运动状态的完整信息。在人体动作识别任务中,这些信息能够帮助区分不同的动作和活动模式。 本项目聚焦于利用机器学习算法处理多传感器数据,特别是逻辑回归、梯度提升树、随机森林以及线性支持向量机(SVM)算法。逻辑回归广泛应用于分类问题,尤其是处理特征与标签之间的概率关系。梯度提升树和随机森林属于集成学习方法,它们通过构建多个决策树并结合它们的预测结果,以期望获得更强大的预测能力。线性SVM则适用于解决线性可分和近似线性可分的分类问题,通过找到最佳的分割超平面将不同类别的数据分隔开来。 本项目的核心是使用这些算法来实现人体动作分类识别,旨在面向智能穿戴设备和健康监测系统进行行为模式分析。通过构建分类模型,可以实现对用户活动的实时识别和监控,这对于健康状况评估、运动指导、事故预防等方面具有重要的意义。例如,在健康监测系统中,准确识别用户的日常行为模式可以为用户提供个性化的生活建议,提高生活质量。 项目的研究和开发不仅需要机器学习算法的支持,还需要大量的数据集来进行训练和测试。UCI(加利福尼亚大学欧文分校)机器学习存储库提供了大量经过预处理的、适合机器学习研究的数据集。项目中使用的数据集正是基于加速度计和陀螺仪收集的人体动作数据,它包含多个用户在不同条件下执行的各种动作,这些数据经过格式化和预处理后,用于训练和评估机器学习模型。 附赠资源文件和说明文件为项目提供了额外的支持,可能包括项目背景、算法细节、使用方法、实验结果以及可能的应用场景。说明文件可能详细阐述了如何安装和配置所需的软件环境,如何运行项目代码,以及如何解读输出结果。此外,附赠资源可能包含一些教学资料或文献,帮助理解多传感器数据融合技术在智能穿戴设备和健康监测系统中的应用。 总体来说,本项目利用先进的机器学习技术处理多传感器数据,对于提升智能穿戴设备的功能性和智能健康监测系统的能力具有重要的推动作用。通过准确识别用户的行为模式,不仅可以帮助个人更好地管理自己的健康和生活习惯,也可以为医疗保健提供重要的辅助决策支持。
2026-03-03 09:25:50 2.3MB
1
智慧铁路巡检隧道渗水地铁隧道漏水检测数据集包含了2575张图片,每张图片均用PascalVOC格式和YOLO格式的标注。其中PascalVOC格式包括xml文件,而YOLO格式包括txt文件。数据集包含图片数量为2757张,每张图片均对应一个VOC格式的xml标注文件和一个YOLO格式的txt标注文件。标注类别总数为1,全部标注都针对同一个类别,即"water"。 标注内容包括4598个标注框,每个标注框都是用来标识图像中"water"类别的位置。数据集中的图像分辨率为640x640像素。标注工作是用labelImg工具完成的,采用的规则是在目标类别"water"的位置画上矩形框。此数据集存放在firc-dataset仓库中,可以进行公开访问和使用。尽管数据集已经过精细制作,但其发布方特别声明不对通过此数据集训练出的模型或权重文件的精度进行任何保证。 为方便浏览,数据集提供了一些图片的预览,这些图片清晰地展示了铁路隧道和地铁隧道中的渗水情况。此外,数据集中还包含一些标注的示例,这些示例图片上的标注框清楚地标出了漏水的位置,这可以帮助使用者更好地理解标注的含义和方法。 数据集旨在为机器学习、计算机视觉及相关领域的研究者和开发者提供用于检测隧道渗水问题的视觉数据,以期通过先进的图像识别技术提升铁路和地铁隧道的安全性。由于标注工作的精细度以及数据集的高分辨率,这一数据集对于推动相关领域的技术创新和应用发展具有重要意义。
2026-03-02 17:19:50 1KB 数据集
1