赞
踩
代码为:
#!/usr/bin/env python # -*- coding:utf-8 -*- import pandas as pd # 探索酒类消费数据,主要考查分组聚合的使用 # 1. 将数据框命名为drinks #drinks = pd.read_csv('data_analysis/drinks.csv',index_col=0) #指定具体列作为数据框的行索引 drinks = pd.read_csv('data_analysis/drinks.csv') #2. 哪个大陆(continent)平均消耗的啤酒(beer)更多? drinks.groupby('continent').agg({'beer_servings': 'mean'}).idxmax() #取出具体的大陆 mid = drinks.groupby('continent').agg({'beer_servings': 'mean'}) #分组聚合的结果 print(mid) mid.loc['EU'] # 3. 打印出每个大陆(continent)的红酒消耗(wine_servings)的描述性统计值。 drinks.groupby('continent').agg({'wine_servings': 'describe'}) # 描述性统计信息里面包括count、mean、std、min、25%、50%、75%、max drinks.groupby('continent')['wine_servings'].describe() # 4. 打印出每个大陆每种酒类别的消耗平均值。 drinks.groupby('continent').mean() drinks.groupby('continent').agg('mean') drinks.groupby('continent').agg(['mean', 'max', 'std']) # 5. 打印出每个大陆每种酒类别的消耗中位数。 drinks.groupby('continent').median() # 6. 打印出每个大陆对spirit_servings饮品消耗的平均值,最大值和最小值。 drinks.groupby('continent').agg({'spirit_servings': ['mean', 'max', 'min']})
文件‘drinks.csv’中的数据截图为:
运行结果截图如下所示:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。