2020-09-30
阅读量:
614
使用python进行客户流失案例分析
1 商业理解
流失客户是指那些曾经使用过产品或服务,由于对产品失去兴趣等种种原因,不再使用产品或服务的顾客。
电信服务公司经常使用客户流失分析和客户流失率作为他们的关键业务指标之一,因为留住一个老客户的成本远远低于获得一个新客户。
通过评估客户流失的风险倾向来预测客户流失,对于潜在的高概率流失客户,可以有效地实施客户保留营销计划。
2 数据理解
分析数据来自于统计自某电信公司一段时间内的消费数据。共有7043笔客户资料,每笔客户资料包含21个字段,其中1个客户ID字段,19个输入字段及1个目标字段-Churn(Yes代表流失,No代表未流失),输入字段主要包含以下三个维度指标:用户画像指标、消费产品指标、消费信息指标。字段的具体说明如下:
3 数据读入和概览
3.1 查看缺失值
3.2 查看重复值
3.3 错误值处理
4 探索性分析
对指标进行归纳梳理,分用户画像指标,消费产品指标,消费信息指标。探索影响用户流失的关键因素。
4.1 标签分布
4.2 用户性别与是否流失
流失客户在性别方面基本没有显著性差异。
4.3 用户年龄与是否流失
4.4 用户婚姻与是否流失
4.5 用户经济与死否流失
4.6 用户付款与是否流失
4.7 数值型特征的分布
5 数据预处理与特征工程
5.1 字符型数据编码
5.2 特征选择
6 模型构建与评估
对于客户流失预测的分类问题,本次选择集成学习Baging下的随机森林算法和Boosting下的Xgboost算法分别进行建模和分析。
6.2 Xgboost






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论