当前位置:   article > 正文

31机器学习项目实战-用户流失预警_用户流失预警唐宇迪

用户流失预警唐宇迪

唐宇迪《python数据分析与机器学习实战》学习笔记
31机器学习项目实战-用户流失预警

1.数据简单介绍

挽留一个老客户的费用<扩展一个新用户费用,所以通过预测给部分老用户大礼包让其留下来。
这里使用的数据为一个国外的电信商数据:
在这里插入图片描述
在这里插入图片描述
这个小项目没做特征工程,大致走一下流程,所以这里只简单谈一下数据:D手机号码、E/F参加某个计划、H/I/J白天打了多少时间/个数/话费,K/L/M下午,N/O/P晚上,Q/R/S国际长途,U就是Label:用户是否流失了。False没流失、True流失了。

2.数据导入及简单筛选

#模块导入
from __future__ import division
import pandas as pd
import numpy as np
#数据读取
churn_df = pd.read_csv('churn.csv')
col_names = churn_df.columns.tolist()

print "Column names:"
print col_names

to_show = col_names[:6] + col_names[-6:]

print "\nSample data:"
churn_df[to_show].head(6)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

数据的丢除、转换、归一化

churn_result = churn_df['Churn?']
y = np.where(churn_result == 'True.',1,0)

# 丢除无用列
to_drop = ['State','Area Code','Phone','Churn?']
churn_feat_space = churn_df.drop(to_drop,axis=1)

# 把Yes/No转换为布尔值1/0
yes_no_cols = ["Int'l Plan","VMail Plan"]
churn_feat_space[yes_no_cols] = churn_feat_space
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/355401?site
推荐阅读
相关标签
  

闽ICP备14008679号