当前位置:   article > 正文

【Python数据分析与可视化】Pandas统计分析-实训_用pandas完成以下操作:(2)查看数据的描述信息(3)分析男性顾客和女性顾客谁更慷慨

用pandas完成以下操作:(2)查看数据的描述信息(3)分析男性顾客和女性顾客谁更慷慨

Python数据分析与可视化】Pandas统计分析-实训

导包

import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']#显示中文标签
plt.rcParams['axes.unicode_minus']=False #显示负号
%matplotlib inline
  • 1
  • 2
  • 3
  • 4
  • 5

读取数据

f1=pd.read_excel('tips.xls')
f1.head()
  • 1
  • 2
total_billtipsexsmokerdaytimesize
016.991.01FemaleNoSunDinner2
110.341.66MaleNoSunDinner3
221.013.50MaleNoSunDinner3
323.683.31MaleNoSunDinner2
424.593.61FemaleNoSunDinner4

分析数据

1、查看数据的描述和统计信息;

f1.describe()
  • 1
total_billtipsize
count244.000000244.000000244.000000
mean19.7859432.9982792.569672
std8.9024121.3836380.951100
min3.0700001.0000001.000000
25%13.3475002.0000002.000000
50%17.7950002.9000002.000000
75%24.1275003.5625003.000000
max50.81000010.0000006.000000

2、修改列名为汉字,并显示前5行数据;

f1.columns =['总金额','小费金额','性别','吸烟','星期','时间','人数']
f1.head()
  • 1
  • 2
总金额小费金额性别吸烟星期时间人数
016.991.01FemaleNoSunDinner2
110.341.66MaleNoSunDinner3
221.013.50MaleNoSunDinner3
323.683.31MaleNoSunDinner2
424.593.61FemaleNoSunDinner4

3、计算人均消费;

f1['人均消费']=round(f1['总金额']/f1['人数'],2)
f1.head()
  • 1
  • 2
总金额小费金额性别吸烟星期时间人数人均消费
016.991.01FemaleNoSunDinner28.49
110.341.66MaleNoSunDinner33.45
221.013.50MaleNoSunDinner37.00
323.683.31MaleNoSunDinner211.84
424.593.61FemaleNoSunDinner46.15

4、查询吸烟男性中人均消费大于15的数据;

# f1[ (f1['吸烟']=='Yes') & (f1['性别']=='Male') & (f1['总金额']> 15) ]
f1.query( '吸烟=="Yes" & 性别=="Male" & 总金额>15').head()
  • 1
  • 2
总金额小费金额性别吸烟星期时间人数人均消费慷慨度
5638.013.00MaleYesSatDinner49.500.073153
6020.293.21MaleYesSatDinner210.140.136596
6318.293.76MaleYesSatDinner44.570.170522
6915.012.09MaleYesSatDinner27.500.122222
7617.923.08MaleYesSatDinner28.960.146667

5、分析小费金额和消费金额的关系;

f1.plot.scatter(x='总金额', y='小费金额', color='DarkBlue', label='小费金额与总金额的关系')
  • 1

在这里插入图片描述

6、分析男性顾客和女性顾客谁更慷慨;

average_tip  = f1.groupby('性别')['小费金额'].mean()
average_tip.plot.bar()
  • 1
  • 2

在这里插入图片描述

7、分析星期和小费数额的关系;

average_tip  = f1.groupby('星期')['小费金额'].mean()
average_tip.plot.bar()
  • 1
  • 2

在这里插入图片描述

8、性别+吸烟的组合对慷慨度的影响;

# 构建慷慨度指标
f1['慷慨度']=f1['小费金额']/(f1['总金额']+f1['小费金额'])
r=f1.groupby(['性别','吸烟'])['慷慨度'].mean()
r.plot(kind='bar',x=['性别','吸烟'],y='慷慨度')
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

9、分析聚餐时间与小费数额的关系;

time = f1.groupby('时间')['小费金额'].mean()
time.plot.bar()
  • 1
  • 2

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/533098
推荐阅读
相关标签
  

闽ICP备14008679号