赞
踩
唐宇迪《python数据分析与机器学习实战》学习笔记
31机器学习项目实战-用户流失预警
挽留一个老客户的费用<扩展一个新用户费用,所以通过预测给部分老用户大礼包让其留下来。
这里使用的数据为一个国外的电信商数据:
这个小项目没做特征工程,大致走一下流程,所以这里只简单谈一下数据:D手机号码、E/F参加某个计划、H/I/J白天打了多少时间/个数/话费,K/L/M下午,N/O/P晚上,Q/R/S国际长途,U就是Label:用户是否流失了。False没流失、True流失了。
#模块导入
from __future__ import division
import pandas as pd
import numpy as np
#数据读取
churn_df = pd.read_csv('churn.csv')
col_names = churn_df.columns.tolist()
print "Column names:"
print col_names
to_show = col_names[:6] + col_names[-6:]
print "\nSample data:"
churn_df[to_show].head(6)
数据的丢除、转换、归一化
churn_result = churn_df['Churn?']
y = np.where(churn_result == 'True.',1,0)
# 丢除无用列
to_drop = ['State','Area Code','Phone','Churn?']
churn_feat_space = churn_df.drop(to_drop,axis=1)
# 把Yes/No转换为布尔值1/0
yes_no_cols = ["Int'l Plan","VMail Plan"]
churn_feat_space[yes_no_cols] = churn_feat_space
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。