本项目的数据来源于网新银行举办的数据建模比赛的数据,特征包含三类数据,客户基本信息(x1-x11),行为类数据(x12-x56),风险评分类数据(x57-x161),但具体是什么特征我们并无从得知,因此想从特征实际意义入手分析建模是及其困难的。数据包含训练30000个样本,测试10000个样本,每个样本除开161个特征变量,还包括干预变量(treatment)和响应变量(y),干预变量把数据分为两类,实验(treatment = 1),控制(treatment = 0),实验和控制的比例大致为1:4。 源码包含用随机森林做缺失值填充、画qini曲线、主程序三个文件 原文链接:https://blog.csdn.net/qq_52073614/article/details/136763601
2024-10-29 21:38:07 4.88MB 数据集
1
《Netflix项目:基于R语言的数据分析实践》 Netflix,全球知名的在线流媒体平台,拥有海量的用户观影数据,这些数据为研究用户行为、推荐系统优化提供了丰富的资源。本项目聚焦于利用R语言对Netflix相关数据进行深入分析,旨在揭示其中蕴含的模式和趋势,以提升用户体验和内容推荐的精准度。 一、数据介绍 Netflix数据通常包含用户的观影历史、评分、以及电影或电视剧的相关信息。这些数据可以分为两个主要部分:用户行为数据和内容元数据。用户行为数据记录了用户的观影时间、评分等,而内容元数据则包括电影或电视剧的类型、演员、导演等信息。通过这些数据,我们可以深入了解用户的观看习惯和偏好。 二、R语言基础 R语言是统计学和数据分析领域广泛使用的编程语言,其强大的数据处理、可视化和建模能力使得它成为处理大规模数据的理想工具。本项目中,我们将使用R语言的tidyverse套件,包括dplyr用于数据操作,ggplot2用于数据可视化,以及tidyr用于数据清洗。 三、数据预处理 在分析前,首先需要对数据进行预处理,包括数据清洗(如处理缺失值、异常值)、数据转换(如标准化、归一化)和数据整合(将多个数据源合并)。使用dplyr,我们可以方便地完成这些任务,比如通过`filter()`筛选特定行,`mutate()`创建新变量,`group_by()`进行分组,以及`summarise()`进行统计汇总。 四、探索性数据分析 探索性数据分析(EDA)是理解数据的关键步骤。通过ggplot2,我们可以创建各种图表,如直方图、散点图和折线图,来探索用户评分分布、观影时间模式等。此外,还可以使用相关性分析来寻找不同变量之间的关系。 五、用户聚类分析 为了识别用户群体,可以使用聚类算法如K-means或层次聚类。通过分析用户的观影选择和评分,可以将用户划分为不同的群体,这有助于Netflix理解不同用户群体的特征,从而提供更个性化的推荐。 六、推荐系统构建 推荐系统是Netflix的核心之一,常见的方法有基于内容的推荐和协同过滤。在R中,可以使用Surprise库来实现协同过滤算法,通过预测用户对未评分项目的评分,来生成推荐列表。 七、模型评估与优化 推荐系统的性能需要通过准确率、覆盖率、多样性等指标来衡量。使用交叉验证和AUC-ROC曲线可以帮助我们评估模型的性能,并通过调整模型参数进行优化。 八、结果解释与可视化 我们需要将分析结果以易理解的方式呈现出来,如制作热力图展示用户与电影的关联性,或者通过交互式可视化工具如Shiny创建动态应用,使非技术人员也能理解分析结果。 这个Netflix项目运用R语言对数据进行深度挖掘,旨在揭示用户行为模式,优化推荐系统,提升Netflix的服务质量。通过实际操作,不仅能提升R语言技能,还能深入理解数据驱动决策的重要性。
2024-10-28 11:13:35 58KB R
1
VeRi-776数据, 用于智慧交通系统中车辆的REID重识别模型,减少跟踪ID的switch切换次数。
2024-10-28 10:33:15 950.81MB 数据集
1
各个版本Microsoft Visual C++运行库下载 下载后直接安装即可 Win7和Win10都可以安装(Win7安装时会出现部分运行库版本过高导致无法安装,到时取消安装不能安装的运行库即可)
2024-10-27 00:23:48 28.63MB windows microsoft
1
手写数字识别,解压后进行加载: from scipy.io import loadmat mnist = loadmat('/app/datasets/mnist-original.mat') mnist.keys()
2024-10-26 16:23:29 9.74MB scikitlearn python
1
Giant Golem AnimSet 巨型傀儡动画Unity游戏动画插件资源unitypackage 版本1.0 支持Unity版本2020.3.38或更高 巨型傀儡动画包含超过 32 个动画 描述 推荐 该资源包适用于巨型傀儡等怪物。 舞台大老板。 特征 动态关键帧动画 包括通用和人形版本 包括根部运动和就地运动 包括 T 形姿势(人形文件夹) 动画列表 空闲1 攻击12 防御3 死亡2 下降 1 击中 6 上升1 眩晕开始/眩晕循环/眩晕结束 前走/左走/右走
2024-10-23 12:59:47 17.53MB unity unitypackage 游戏开发
1
Giant Golem动画包含32+个动画, 这个资产包是为巨人这样的怪物准备的。 关卡大Boss。 特点 动态关键帧动画 Generic和Humanoid版本 包括Root运动和Inplace运动 包括T-pose(人形文件夹) 动画列表 Idle 1 Attack 12 defence 3 Dead 2 Down 1 hit 6 Rise 1 Stun_Start / Stun_Loop / Stun_End Walk_Front / Walk_Left / Walk_Right
2024-10-23 12:57:40 17.5MB
1
ultralytics yolo 训练及推理自定义人脸关键点数据 - python 实现 ultralytics yolo 训练自定义人脸关键点训练和验证数据 数据格式:yolo 训练数量:3295 验证数量:120 类别:人脸,1类 类别号:0 关键点:5个,包括左眼,右眼,鼻尖,左嘴唇边界点,右嘴唇边界点。
2024-10-22 15:12:20 327.2MB 数据集 yolo 人脸关键点检测 目标检测
1
加州房价数据,可以用于数据分析、机器学习和深度学习的学习使用
2024-10-22 09:24:55 29.54MB 深度学习 机器学习 数据集
1
标题 "Intel UHD Graphics 630 Win7 X64 驱动" 指的是适用于Windows 7 64位操作系统的一个图形处理器驱动程序,该驱动是为Intel的UHD Graphics 630成显卡设计的。Intel UHD Graphics 630是Intel第七代酷睿(Kaby Lake)处理器家族中的一部分,它提供了高清图形处理能力,适用于日常办公、娱乐以及轻度游戏。 描述中提到"I3 7代cpu成的显卡驱动",意味着这个驱动程序是为第七代Intel Core i3处理器中的成显卡——Intel UHD Graphics 630准备的。描述还指出,该驱动在联想扬天M4000系列电脑上进行了测试,并且在Windows 7 SP1 x64系统环境下能够正常安装和运行。通常情况下,直接从官方下载的驱动可能会因为系统兼容性问题而无法安装,但这个版本已经过验证,可以解决这个问题。 标签 "显驱动 Intel WIn7x64" 进一步强调了这是一个针对Intel成显卡的驱动程序,适用于Windows 7 64位系统。成显卡是内建在处理器内部的图形处理单元,相较于独立显卡,它们通常功耗更低,成本更经济,适合不追求高性能图形运算的用户。 压缩包内的文件名 "intel 8100 UHD630 Win64" 可能指的是一个特定的驱动版本,8100可能代表某个产品型号或版本编号,与Intel UHD Graphics 630相匹配,而Win64再次确认这是64位Windows系统的驱动。 安装这个驱动程序的重要性在于,它可以优化Intel UHD Graphics 630的性能,确保图形显示的流畅性和稳定性,同时提供必要的功能更新和错误修复。对于那些使用成显卡的用户,安装正确的驱动可以提高系统整体效率,提升视频播放、游戏体验和其他图形密型应用的性能。安装步骤一般包括下载驱动文件,解压,然后通过设备管理器或驱动安装向导进行安装。如果遇到像描述中所述的官方驱动无法安装的情况,用户可以尝试寻找第三方验证过的兼容版本来解决问题。
2024-10-21 16:54:48 167.5MB 集显驱动 Intel WIn7x64
1