赛题数据由训练集和测试集组成,总数据量超过25w,包含69个特征字段。为了保证比赛的公平性,将会从中抽取15万条作为训练集,3万条作为测试集,同时会对部分字段信息进行脱敏。 特征字段:客户ID、地理区域、是否双频、是否翻新机、当前手机价格、手机网络功能、婚姻状况、家庭成人人数、信息库匹配、预计收入、信用卡指示器、当前设备使用天数、在职总月数、家庭中唯一订阅者的数量、家庭活跃用户数、....... 、过去六个月的平均每月使用分钟数、过去六个月的平均每月通话次数、过去六个月的平均月费用、是否流失
1
分类 电信客户流失预测。 关于该项目- 在这个项目中,我使用各种分类算法,使用数据集中的特征预测客户流失率。 使用的Python软件包-Pandas,Numpy,Scipy,scikit-learn,Seaborn和matplotlib。 关于数据集: 每行代表一个客户,每列包含在元数据列中描述的客户属性。 数据集包含有关以下信息:上个月内离开的客户–该列称为每个客户都已注册的Churn Services –电话,多条线路,互联网,在线安全,在线备份,设备保护,技术支持和流媒体电视和电影客户帐户信息-他们成为客户的时间,合同,付款方式,无纸化账单,每月费用和总费用有关客户的人口统计信息-性别,年龄段以及是否有合作伙伴和受抚养人 致谢- 从下载了数据集 该项目涉及- 1)探索性数据分析-删除不必要的功能,处理空值和离群值(如果有)。 使用具有目标变量的独立特征的KDE图,箱线图和Ba
2022-06-13 22:52:11 318KB JupyterNotebook
1
电信客户流失预测挑战赛数据集.zip
2022-06-09 19:05:59 258.6MB 机器学习
1
ID3算法在电信客户流失中的应用.doc
2022-05-25 14:08:40 75KB 文档资料 算法
网络技术-综合布线-影响电信宽带客户流失的原因分析.pdf
2022-05-12 18:06:25 5.69MB 文档资料
人工智能-机器学习-改进的模糊聚类算法在预测移动客户流失中的应用研究.pdf
2022-05-05 09:09:56 2.75MB 算法 聚类 人工智能 机器学习
安全技术-网络信息-模糊贝叶斯网络在电信客户流失分析中的研究与应用.pdf
2022-04-28 19:00:47 2.69MB 文档资料 安全 网络
对数据探索分析,进行模型训练,测试数据集评估结果,建立可预测客户流失的模型,获取可能流失的用户名单。
2022-04-25 10:05:41 100KB python 机器学习 文档资料 开发语言
数据挖掘:利用sql实现对电信行业客户建立流失预警模型
2022-03-04 18:37:23 1.7MB 数据挖掘
1
基于kaggle平台上--电信客户流失数据集,利用生存分析进行流失预测 https://www.kaggle.com/blastchar/telco-customer-churn 0 customerID 客户编号 1 gender 性别 2 SeniorCitizen 是否是老年人 3 Partner 是否单身 4 Dependents 经济是否独立 5 tenure 已使用月份数 6 PhoneService 电话业务 7 MultipleLines 多线业务 8 InternetService 网络服务业务 9 OnlineSecurity 网络安全业务 10 OnlineBackup 网络备份业务 11 DeviceProtection 设备保护业务 12 TechSupport 技术支持业务 13 StreamingTV 网络电视业务 14 StreamingMovies 网络电影业务 15 Contract 合同方式 16 PaperlessBilling 电子账单 17 PaymentMethod 支付方式 18 MonthlyCharges 月费用 19 Total
2022-01-28 09:06:23 186KB kaggle