当前位置:   article > 正文

基于python的超市历年数据可视化分析_超市消费客户画像大数据可视化分析(3)

基于python的超市历年数据可视化分析_超市消费客户画像大数据可视化分析(3)

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

Order ID => 每个客户的唯一订单ID.
Order Date => 产品的订单日期.
Ship Date => 产品发货日期.
Ship Mode=> 客户指定的发货模式.
Customer ID => 标识每个客户的唯一ID.
Customer Name => 客户的名称.
Segment => The segment where the Customer belongs.
Country => 客户居住的国家.
City => 客户居住的城市.
State => 客户所在的州.
Postal Code => 每个客户的邮政编码.
Region => “客户”所属地区.
Product ID => 产品的唯一ID.
Category => 所订购产品的类别.
Sub-Category => 所订购产品的子类别.
Product Name => 产品名称
Sales =>产品的销售.
Quantity => 产品数量.
Discount => 提供折扣.
Profit => 已发生的利润/亏损.


##### 1、数据概览


9994行,21列数据



  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

print(df.info())



  • 1
  • 2

<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 9994 entries, 0 to 9993
Data columns (total 21 columns):

Column Non-Null Count Dtype


0 Row ID 9994 non-null int64
1 Order ID 9994 non-null object
2 Order Date 9994 non-null object
3 Ship Date 9994 non-null object
4 Ship Mode 9994 non-null object
5 Customer ID 9994 non-null object
6 Customer Name 9994 non-null object
7 Segment 9994 non-null object
8 Country 9994 non-null object
9 City 9994 non-null object
10 State 9994 non-null object
11 Postal Code 9994 non-null int64
12 Region 9994 non-null object
13 Product ID 9994 non-null object
14 Category 9994 non-null object
15 Sub-Category 9994 non-null object
16 Product Name 9994 non-null object
17 Sales 9994 non-null float64
18 Quantity 9994 non-null int64
19 Discount 9994 non-null float64
20 Profit 9994 non-null float64
dtypes: float64(3), int64(3), object(15)
memory usage: 1.6+ MB
None


![在这里插入图片描述](https://img-blog.csdnimg.cn/e5d53be88ddf4952a4371d9e9ba4e9aa.png)


#### 二、数据预处理


##### 0、导入包和数据



  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode

data = pd.read_csv(r’./data/Superstore.csv’)


##### 1、列名重命名


重命名后的列名:



  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

data.columns = [‘行ID’, ‘订单ID’, ‘订单日期’, ‘发货日期’, ‘发货方式’, ‘客户ID’, ‘客户名称’, ‘客户类型’, ‘国家’, ‘城市’, ‘州’, ‘邮政编码’, ‘所属区域’, ‘产品ID’,
‘产品类别’, ‘产品子类别’, ‘产品名称’, ‘销售额’, ‘产品数量’, ‘提供折扣’, ‘利润/亏损’]


##### 2、提取数据中时间,方便后续分析绘图



  • 1
  • 2
  • 3
  • 4
  • 5

data[‘年份’] = data[‘订单日期’].apply(lambda x: x[-4:])
data[‘日期’] = pd.to_datetime(data[‘订单日期’], format=‘%m/%d/%Y’)
data[‘月份’] = data[‘日期’].dt.month
data[‘年-月’] = data[‘年份’].astype(‘str’) + ‘-’ + data[‘月份’].astype(‘str’)


#### 三、数据可视化


##### 1、美国各个地区销售额的分布(地图)


包含:Order\_Date Sales Quantity Profit year month



  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

usa_sale = data[[‘州’, ‘销售额’]].groupby(‘州’).sum().round(2).reset_index()
print(usa_sale.head())

def echarts_map(province, data, title=‘主标题’, subtitle=‘副标题’, label=‘图例’):
“”"
province:传入省份List
data:传入各省对应的数据List

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

知识点,真正体系化!**

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/681867
推荐阅读
相关标签
  

闽ICP备14008679号