项目概况 开发环境:Jupyter Notebook(Anaconda3的应用包下) 项目描述 一、获取数据集并预处理 在网上(例如Kaggle)下载数据集,读入数据并进行数据预处理。 二、根据特征群进行可视化分析 数据总体分成三大特征群,逐一分析各特征群下,每个特征在特征群中的重要程度,在客户流失因素上的重要程度。对数据进行可视化分析,通过饼状图的对比,对各项特征指标有一个直观的清晰的 认识。 三、特征工程与类别平衡 数据预测前一系列处理,先进行特征工程处理,结合皮尔逊相关系数,把无用特征进行剔除,完善字符编码格式。再处理类别不平衡的问题(正负样本数相差较多,易导致数据倾斜或不准确)。 四、模型使用与评估 使用机器学习模型与模型评估方式,用K折交叉验证计算方式,分别对逻辑回归,随机森林,AdaBoost,XGBoost模型进行评估,得出预测模型的准确度,后续选择其中之一进行实际预测,并输出模型中的特征重要性。 五、总结分析与制定决策 总结分析,合并各客户的预测流失率与真实流失率,形成关系表。运营商可以根据分组情况的结果设定阈值并进行决策,从而确定分界点进行客户召回措施。
2024-06-28 13:06:06 10.88MB Kaggle
1
基于Orange Telecom历史数据开发的客户流失预测模型的数据集和要求
2024-04-17 14:30:13 221KB 数据集
1
摘 要:本文简述了BP 神经网络的基本原理,提出了一种基于 BP 神经网络的客户流失 预测模型。实验表明,该模型的辨识精度高,能正确的对客户的需求进行评估,以减少客户 流失来提高企业的利润。 关键词:神经网络;BP 算法;客户流失;CRM
2022-12-15 22:02:08 302KB 神经网络 客户流失 预测 应用
1
Python应用实战代码-Python 银行信用卡客户流失预测(kaggle)
2022-07-05 11:34:13 3.08MB Python 数学建模 风控
赛题数据由训练集和测试集组成,总数据量超过25w,包含69个特征字段。为了保证比赛的公平性,将会从中抽取15万条作为训练集,3万条作为测试集,同时会对部分字段信息进行脱敏。 特征字段:客户ID、地理区域、是否双频、是否翻新机、当前手机价格、手机网络功能、婚姻状况、家庭成人人数、信息库匹配、预计收入、信用卡指示器、当前设备使用天数、在职总月数、家庭中唯一订阅者的数量、家庭活跃用户数、....... 、过去六个月的平均每月使用分钟数、过去六个月的平均每月通话次数、过去六个月的平均月费用、是否流失
1
分类 电信客户流失预测。 关于该项目- 在这个项目中,我使用各种分类算法,使用数据集中的特征预测客户流失率。 使用的Python软件包-Pandas,Numpy,Scipy,scikit-learn,Seaborn和matplotlib。 关于数据集: 每行代表一个客户,每列包含在元数据列中描述的客户属性。 数据集包含有关以下信息:上个月内离开的客户–该列称为每个客户都已注册的Churn Services –电话,多条线路,互联网,在线安全,在线备份,设备保护,技术支持和流媒体电视和电影客户帐户信息-他们成为客户的时间,合同,付款方式,无纸化账单,每月费用和总费用有关客户的人口统计信息-性别,年龄段以及是否有合作伙伴和受抚养人 致谢- 从下载了数据集 该项目涉及- 1)探索性数据分析-删除不必要的功能,处理空值和离群值(如果有)。 使用具有目标变量的独立特征的KDE图,箱线图和Ba
2022-06-13 22:52:11 318KB JupyterNotebook
1
电信客户流失预测挑战赛数据集.zip
2022-06-09 19:05:59 258.6MB 机器学习
1
基于kaggle平台上--电信客户流失数据集,利用生存分析进行流失预测 https://www.kaggle.com/blastchar/telco-customer-churn 0 customerID 客户编号 1 gender 性别 2 SeniorCitizen 是否是老年人 3 Partner 是否单身 4 Dependents 经济是否独立 5 tenure 已使用月份数 6 PhoneService 电话业务 7 MultipleLines 多线业务 8 InternetService 网络服务业务 9 OnlineSecurity 网络安全业务 10 OnlineBackup 网络备份业务 11 DeviceProtection 设备保护业务 12 TechSupport 技术支持业务 13 StreamingTV 网络电视业务 14 StreamingMovies 网络电影业务 15 Contract 合同方式 16 PaperlessBilling 电子账单 17 PaymentMethod 支付方式 18 MonthlyCharges 月费用 19 Total
2022-01-28 09:06:23 186KB kaggle
流失预测 使用人工神经网络的客户流失预测 问题陈述 任务是预测某个客户是否会放弃公司。 也就是说,要预测“客户流失”属性。 通常,为每个客户国家/地区提供的信息帐户长度区号电话国际计划VMail计划VMail消息日间日间通话日间收费夏娃·明斯平安夜电话夏娃冲锋夜分钟夜间通话夜间收费国际分钟国际通话国际收费客户服务电话搅拌? 内容 数据探索 数据预处理 训练模式 可视化模型
1
针对电信领域客户流失的问题,提出了改进聚类的客户流失预测模型。根据通信行业中实际客户流失数据的正负样本数量不平衡而且数据量特别大的特点,提出带有不同权重参数的改进聚类算法,并将其用于电信行业的客户流失预测模型中。通过实际电信客户数据集测试,与传统的预测算法比较,证明这种算法适合解决大数据集和不平衡数据,具有更高的精确度,能够取得较好的客户流失预测效果。
2021-12-17 21:53:32 204KB 聚类 客户流失 加权 预测分析
1