赞
踩
---------------------------------------------------------------------------------------------------------------------------------
01.官方要求
根据父母的购买行为预测孩子的年龄,或根据孩子的信息预测用户会购买什么样的商品
02.自我分析和要求(基于表格内容)
a.分析一级商品和二级商品的销售情况
b.分年度、季度和月度对产品总销售量进行分析
c.对不同商品销量进行对比、对不同时期销售情况进行对比,是否存在异常情况
d.孩子的性别分布情况以及不同性别的孩子最喜欢的商品类型、不同产品购买人群孩子的性别占比
e.年龄段分布、不同年龄段的销售总量情况、不同年龄段的销售偏好(哪一类产品最多)
01.数据获取来源
阿里天池:淘宝母婴购物数据集
02.表格内容
01.选择有用数据
auction_id 订单号 以及 property商品属性对本次数据分析没有帮助,进行隐藏
02.删除重复数据
无重复数据
03.排除缺失值
查找和选择--定位条件--空值 无缺失值
04.一致化处理
1.购买日期和出生日期都转换成'YYYY/M/D'格式
数据-分列-其他(无)-日期
2.列名都转换成中文
3.孩子的性别转换成‘男’,‘女’,‘其他’
4.用购买日期和出生日期作差来计算孩子的年龄,并转换成年龄段,方便后续分析
05.异常值
将两个表格用VLOOKUP连接后(增加了孩子年龄和年龄段),删除没有匹配的用户
删除性别为‘其他’的用户数据
删除年龄中的异常值,既不能为负值,也不能大于12
订单数量中太大的数字不能够保留,会对数据分析产生负面影响,这个应当和相关部门进行沟通,我在数据分析过程中将一个160的购物数量删除掉(可能是团购或者企业购买),来分析零售的销售情况
01.产品角度
A.一级商品销售情况
根据图标可以分析得知,50008168是销量最好的一级商品,远超过其他的商品,这应该是公司的主推商品系列。
B.销量最好的一级商品下的二级商品销量TOP10
通过建设数据透视表和切片器可以得到每个一级商品下的二级商品销量,选择50008168即可得到二级商品的销量排名情况,其中50013636是销量最高的二级商品
02.时间角度
A.不同年份、季度和月度销售情况
从图中可以看出,2012年到2014年商品的销量在不断增长,但是2015年却大幅度下降,但是这并不是因为2015年销量减少,根据季度销售量情况和月度销售量情况可以得知2015年只统计到2月5号。
从季度的角度分析,往往第二季度和第四季度销售量最高,个人认为这和网上购物节有关。接下来结合月度销售量进行分析;
每年第二季度(尤其是5月)销售量都比较高,可能是因为在五一劳动节期间和母亲节期间商品有优惠;同理,在十一月期间,由于双十一购物节的存在,商品的销售量增加;在每年的1-2月期间都会有一个小高峰,并且立刻回落,这是由于春节前商品打折和春节期间快递停运。
B.不同产品的迭代
根据折线图可以看出,50014815在2013年第二季度有一个非常高的销售额,推测是在那个时间商品找到了代言人或者优化了产品结构或者推出了较大的优惠活动,同样也可以用来分析2014年第二季度。然而50008168几乎一直占着最高销售额,说明50008168一直是最受欢迎的产品。
03.用户性别
A.不同用户性别占比
男宝宝占比43%,略低于女宝宝的57%,说明有女宝宝的用户购买需求略大于有男宝宝的用户,当然也应当考虑当时的男女宝宝数量对比情况。
B.不同商品的性别销量对比
男宝宝和女宝宝消费量最大的产品都是50008168。由于有女宝宝的用户消费量本身大于有男宝宝的数量,因此每个商品来看女宝宝销售量都大于男宝宝销售量,其中38商品领先幅度最大,可能是商品包装或者宣传的功效方面更贴近女宝宝。
C.不同性别的商品销量对比
和前面分析的一样,男宝宝和女宝宝消费量最大的产品都是50008168。男宝宝的28和50014815消费量差不多;女宝宝的50014815消费量略高于28
04.年龄
前面为了方便分析,将年龄分成了四个阶段:0-1岁婴儿期、1-3岁幼儿期、3-7岁学龄期、7-12岁小学期
A.不同年龄段销量占比
可以看出用户的孩子多处于婴儿期和幼儿期、其次是学龄期
B.不同商品的不同年龄段销量对比
根据图表可以看出,50008168深受幼儿期用户欢迎。尽管幼儿期用户也大量购买50014815商品,但是50014815商品更受婴儿期用户欢迎。此外,学龄期和小学期选择最多的商品都是50008168
C.不同年龄段的不同商品销量对比
和前面分析一致,幼儿期、学龄期和小学期的用户都喜欢购买50008168;而婴儿期的用户更喜欢购买50014815
1.一级商品中50008168是销量最好的,占总销量的35%,并且近期销售量依旧位于比较高的水平,说明该商品已经有了良好的市场基础和口碑,应当继续当做主要卖点抢占市场。50014815和28销售量差不多,并且都有过高销售额的经历,说明可以通过寻找代言人、投放广告等方式增加宣传,促进销售。对于122650008和50022520商品,由于数据中没有价格元素,因此无法判断这两者是高价商品还是低价但是销售量小的商品,如果是高价商品,可以适当减少产量,加强研发提高商品自身价值,并通过宣传等方式打造品牌,吸引高收入人群购买;如果是低价且不受欢迎的商品,应当进行分析是商品包装太差还是商品质量不达标,解决商品自身问题后,可以使用捆绑销售等方式让客户了解和接受这一产品并自愿消费,提升整体收益。
2.通常来说,母婴产品是用户粘性很大的产品类型,但是该店铺的却鲜有回头客(用户留存率和复购率很低),说明店铺在运营上可能存在很大问题,店铺应当尽快检查线上服务和售后是否存在问题,并给予回头客适当优惠,提高老用户的留存和复购率。
3.节日期间商品销售量远大于平时。店铺可以着重于五月的母亲节和双十一购物节,加大优惠力度,并在节日期间对平时销量一般的商品加大优惠力度,吸引用户购买。
4.男女宝宝购买的商品种类差异比较小,说明该店铺做的商品基本都是通用类型的商品,可以适当涉及一些差异化产品来吸引不同性别宝宝。
5.1-3岁幼儿期间的商品销售量最高,其次是婴儿期、学龄期、小学期。除了婴儿期用户偏好50014815之外,其他用户都是偏好50008168商品。可以加大这两款产品的推广,吸引用户,宣传推广的对象应当是0-7岁孩童的父母。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。