项目概况 开发环境:Jupyter Notebook(Anaconda3的应用包下) 项目描述 一、获取数据集并预处理 在网上(例如Kaggle)下载数据集,读入数据并进行数据预处理。 二、根据特征群进行可视化分析 数据总体分成三大特征群,逐一分析各特征群下,每个特征在特征群中的重要程度,在客户流失因素上的重要程度。对数据进行可视化分析,通过饼状图的对比,对各项特征指标有一个直观的清晰的 认识。 三、特征工程与类别平衡 数据预测前一系列处理,先进行特征工程处理,结合皮尔逊相关系数,把无用特征进行剔除,完善字符编码格式。再处理类别不平衡的问题(正负样本数相差较多,易导致数据倾斜或不准确)。 四、模型使用与评估 使用机器学习模型与模型评估方式,用K折交叉验证计算方式,分别对逻辑回归,随机森林,AdaBoost,XGBoost模型进行评估,得出预测模型的准确度,后续选择其中之一进行实际预测,并输出模型中的特征重要性。 五、总结分析与制定决策 总结分析,合并各客户的预测流失率与真实流失率,形成关系表。运营商可以根据分组情况的结果设定阈值并进行决策,从而确定分界点进行客户召回措施。
2024-06-28 13:06:06 10.88MB Kaggle
1
机器学习期末作业 数据集来源:Kaggle泰坦尼克号罹难乘客生存预测 https://www.kaggle.com/c/titanic/data 代码编辑器:Jupyter Notebook 论文排版:LaTex
2024-06-19 16:53:38 106KB Kaggle
kaggle游乐场系列比赛蓝莓产量的代码,团队利用lasso回归选取变量,利用随机森林对变量重要性进行排序,然后利用多元线性回归、bp神经网络(matlab)、SVR、LightGBM对其进行预测。所有代码如下。.zip
2024-06-11 21:32:31 2.68MB 神经网络
1
give me some credit data
2024-05-23 16:05:52 5.08MB Credit Data Kaggle
1
数据量在四位数左右,可供于机器学习使用,深度学习可能不太够。 不同开源数据库的数据标签格式不统一,可能要手动处理或者做一个多模态。 同时也包括一部分嘴唇的图象数据 仅供交流学习使用 侵删 本人也在做相关实验,欢迎各位在评论区交流经验和算法知识
2024-04-09 16:10:02 873.76MB 数据集 paddlepaddle paddlepaddle 阿里云
1
链接: https://pan.baidu.com/s/1m6nDHKCPlHAHnP0xWhUE5A 提取码: pg3z
2024-04-07 11:13:59 66B 深度学习
1
train.csv:训练集、test.csv:测试集 historical_transactions.csv:信用卡(card_id)在给定商家的历史交易记录,对于每张信用卡,最多包含其三个月的交易记录 new_merchant_transactions.csv:每张信用卡在新商家的购物数据,最多包含两个月的数据(字段说明同上) merchants.csv:数据集所有商家(商家id)的附加信息
2024-04-04 17:45:04 14KB AI
1
matlab svr代码kaggle_表型 戴希扬@UMD CS 从基因型预测表型。 这是用于从基因型@UMD CMSC702 预测表型的 Kaggle 竞赛。 整个代码按原样提供。 要求 -Matlab -Libsvm/Libliner (for SVR) -DeepLearnToolbox (for NN regression) -vl_feat (for gmm) 建议的方法 团结 - logloss.m - dataloader.m - confusion_matrix.m - mynormalize.m - k_mer_feature.m - gmms_feature.m 特征选择 - feature_selection.m - fs_trian_test.m 降维 - dimension_reduct.m K-mer + 种群 + LASSO + NN/SVR - nfold_validation.m: Driver to run nfold cross validation on proporsed methods (SVR) - mytrain.m - mytest.m
2024-03-18 09:30:49 34.42MB 系统开源
1
KaggleLeaf分类 Kaggle竞赛“植物幼苗分类”
2024-01-11 10:43:45 31KB Python
1
手把手教你如何在Kaggle猫狗大战冲到Top2%-------运行成功python3.5------py源代码
2023-11-07 21:33:37 132.02MB Kaggle猫狗大战
1