上传者: 42117116
|
上传时间: 2021-12-19 11:36:17
|
文件大小: 7.93MB
|
文件类型: -
电信客户流失项目
“预测保留客户的行为。分析所有相关的客户数据,并制定针对性的客户保留程序。” [IBM示例数据集]
介绍
这是Kaggle数据集。 每行代表一个客户,每列包含在元数据列中描述的客户属性。 数据集包含有关以下信息:
在上个月内离开的客户–该列称为“客户流失”。
每个客户都已注册的服务-电话,多条线路,互联网,在线安全,在线备份,设备保护,技术支持以及流电视和电影。
客户帐户信息-他们成为客户的时间,合同,付款方式,无纸化账单,月度费用和总费用。
有关客户的人口统计信息-性别,年龄范围以及他们是否有伴侣和受抚养人。 该项目的目标是探索这种类型的模型,进一步了解该主题,并提出客户保留计划的建议。
前处理
加载数据后,我检查了重复值和缺失值。 没有重复的值,但“总费用”列中缺少11行。 事实证明,这些行适用于任期为“ 0”个月的客户。 这意味着他们是非常新的客户,并且使用