赞
踩
根据现有数据对消费者进行用户画像的构建,从物理属性和行为属性两个方面进行分析,如下图所示。
导入库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df_raw = pd.read_csv('BlackFriday.csv')
df_raw.sample(5)
# 查看数据信息
df_raw.info()
Product_Category_2 和 Product_Category_3 两个字段存在缺失值。着重分析第一分类,故暂时不做处理。
# 查看岗位编码的数据有哪几种
df_raw['Occupation'].unique()
职业应该是文本类型,所以对上面查询到岗位编码,修改数据
如果有对应的岗位对照表,就可以直接取,本次使用模拟的对照表。
df_raw['Occupation'] = df_raw['Occupation'].replace({ 0:'医生', 1:'警察', 2:'律师', 3:'人力', 4:'程序员', 5:'运营', 6:'产品', 7:'项目管理', 8:'金融', 9:'服装设计', 10:'老师', 11:'教授', 12:'行政', 13:'公务员', 14:'物流', 15:'餐饮', 16:'零售', 17:'农业', 18:'广告',
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。