客户生存与流失预测
客户流失率是评估不断增长的业务的最重要指标之一。 虽然这不是最幸福的衡量标准,但它可以使您的公司了解保留客户的事实。 Heroku应用程序My Heroku应用程序: :
生存分析
生存分析是统计的一个分支,用于分析直到一个或多个事件(例如生物体死亡和机械系统故障)发生之前的预期持续时间。
Kaplan-Meier曲线(我的博客)
脚步
步骤1
问题定义
关键的挑战是预测单个客户是否会流失。
第2步
数据采集
用于此分类问题的数据集来自Kaggle,并来自IBM示例数据集集合( )。
第三步
探索性数据分析
收集数据后,将执行几个步骤来探索数据。 此步骤的目标是了解数据结构,进行初始预处理,清理数据,识别数据中的模式和不一致之处(例如,偏度,离群值,缺失值),并建立和验证假设。
第4步
特征工程
在特征工程中,从现有特征生成新特征,并在将所有特征转换
1