赞
踩
跟着猴子学习数据分析第三关——数据处理,学习完朝阳医院药品销售情况分析后,又找到了阿里巴巴天池数据的婴儿用品销售数据进行分析,主要目的是熟悉数据清洗的流程并对进行数据分析。数据下载地址:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
此案例主要想了解以下情况:
1、有多少消费者购买了婴幼儿用品?
2、消费者中最多的买了多少?最少的买了多少?
3、平均每个用户购买多少?
一、观察数据
数据集是关于婴儿商品,包含有以下的数据字段:
商品表格字段:
user_id:用户身份信息
auction_id:购买行为编号
cat_id:商品种类序列号
cat1:根类别
property:商品属性
buy_mount:购买数量
day:购买时间。
二、按照数据分析的流程分析
1、导入数据:
2、查看数据,数据类型、数据量、数据描述
3、出去异常值、空值,发现阿里的数据很齐整,没有空数据、异常数据
4、按销售的时间排序(升序),序列重新排序
5、计算总的销售数量,消费者人数、平均每个消费者的购买数量
6、结论:
婴幼儿用品销售中,总销售笔数是29971笔,最多的购买了10000,最少的购买了1,销售的总数量是76250,有29944位消费者购买了婴儿用品,平均每个消费者购买了2.5个。但是,最大值是10000,超出了平均值的4000倍,需要结合实际业务判断是不是异常值?
通过分析,发现此数据是一个很好的判断消费者行为的一个数据集,有很多的消费行为待挖掘,如每个大类每月销售多少?销费者平均多久买一次?等等。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。