当前位置:   article > 正文

简单的python文件练习1(批量分析表格:对文件夹中所有的表格进行操作并绘图)

简单的python文件练习1(批量分析表格:对文件夹中所有的表格进行操作并绘图)

一、目标:对文件夹中所有的表格进行操作并绘图
我随机生成了一些关于医院接种某种疫苗的表格数据(取了一些很随便的文件名),并且对此进行分析
表格如下:
在这里插入图片描述
每张表格内容大致如下:
在这里插入图片描述实现:汇总所有表格的总人数,年龄在18-30的人数,对每张表格的打2针和3针的人数进行绘图等

二、此次操作主要用到pandas, os, matplotlib,numpy库
整体代码如下:

import pandas as pd
import os
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np


path = r'D:\python表格练习'
Filelist = []
fileall=[]
Age1830=0
finsh=0
three=0


for home, dirs, files in os.walk(path):
    for filename in files:
            fileall.append(os.path.join(home, filename))# 文件名列表,包含完整路径
            Filelist.append(filename) # # 文件名列表,只包含文件名


for i in range(0,len(Filelist)):
    sheet1= pd.read_excel(fileall[i])
   # print(fileall[i])
    data_age = sheet1[sheet1['年龄'] >= 18][sheet1[sheet1['年龄'] >= 18 ]['年龄'] < 30]#筛选年龄大于等于18且小于30的
    age_18_30=len(data_age)
    Age1830=age_18_30+Age1830
    data_2jizhen=sheet1[sheet1['共需打几针'] ==2]#筛选打针列
    data_3jizhen=sheet1[sheet1['共需打几针'] ==3]
    three=three+len(data_3jizhen)
    data_3yida=sheet1[sheet1['已打几针'] ==3]
    ydw=len(data_3yida)+len(data_2jizhen[data_2jizhen['打了几针']==2])
    finsh=finsh+ydw
    #print("年龄在18-30的人数:",age_18_30,'\n','打3针的人数:',len(data_3jizhen),'\n','打完的人数:',ydw)
    data_age.to_excel(str('D:\python生成表格\\'+Filelist[i]+'年龄18-30.xlsx'))
   
   
    plt.rcParams['font.family'] = 'SimHei'
    plt.rcParams['axes.unicode_minus'] = False
    # 中文乱码问题
    data1 = [len(data_2jizhen), len(data_3jizhen)]# 设置画布大小
    plt.pie(data1, labels=['打两针的人', '打三针的人'])
    plt.title("2针和3针比例" + str(i + 1))
    #plt.figure(figsize=(17, 9), dpi=80)
    plt.savefig(str('D:\python生成饼图\\'+Filelist[i]+'打针统计.jpg'), dpi=300)
    print("已完成表格数量:"+str(i+1))

print(" 年龄在18-30的总人数:",Age1830,'\n','打3针的总人数:',three,'\n','打完的总人数:',finsh)
print("程序完成")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49

生成的表格与对应饼图:
在这里插入图片描述

在这里插入图片描述
三、代码分段结构
1.导入所需的库

import pandas as pd
import os
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
  • 1
  • 2
  • 3
  • 4
  • 5

2.读取文件

for home, dirs, files in os.walk(path):
    for filename in files:
            fileall.append(os.path.join(home, filename))# 文件名列表,包含完整路径
            Filelist.append(filename) # # 文件名列表,只包含文件名
  • 1
  • 2
  • 3
  • 4

3.对读入的内容进行分析

for i in range(0,len(Filelist)):
    sheet1= pd.read_excel(fileall[i])
   # print(fileall[i])
    data_age = sheet1[sheet1['年龄'] >= 18][sheet1[sheet1['年龄'] >= 18 ]['年龄'] < 30]#筛选年龄大于等于18且小于30的
    age_18_30=len(data_age)
    Age1830=age_18_30+Age1830
    data_2jizhen=sheet1[sheet1['共需打几针'] ==2]#筛选打针列
    data_3jizhen=sheet1[sheet1['共需打几针'] ==3]
    three=three+len(data_3jizhen)
    data_3yida=sheet1[sheet1['已打几针'] ==3]
    ydw=len(data_3yida)+len(data_2jizhen[data_2jizhen['打了几针']==2])
    finsh=finsh+ydw
    #print("年龄在18-30的人数:",age_18_30,'\n','打3针的人数:',len(data_3jizhen),'\n','打完的人数:',ydw)
    data_age.to_excel(str('D:\python生成表格\\'+Filelist[i]+'年龄18-30.xlsx'))
    
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

此处主要使用了pandas中读excel的库pd.read_excel

4.绘制饼图


    plt.rcParams['font.family'] = 'SimHei'
    plt.rcParams['axes.unicode_minus'] = False
    # 中文乱码问题
    data1 = [len(data_2jizhen), len(data_3jizhen)]# 设置画布大小
    plt.pie(data1, labels=['打两针的人', '打三针的人'])
    plt.title("2针和3针比例" + str(i + 1))
    #plt.figure(figsize=(17, 9), dpi=80)
    plt.savefig(str('D:\python生成饼图\\'+Filelist[i]+'打针统计.jpg'), dpi=300)
    print("已完成表格数量:"+str(i+1))

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/183361
推荐阅读
相关标签
  

闽ICP备14008679号