赞
踩
# 导包
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
# plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号
import pandas as pd
import numpy as np
# 导入数据
filename = './**.xls'
# df_w 文科生原始数据
# df_l 理科生原始数据
df_w = pd.read_excel(filename, sheet_name=0)
df_l = pd.read_excel(filename, sheet_name=1)
# 查看文科生数据
print(df_w.columns)
df_w.head(3)
学科 | 学校 | 准考证号 | 姓名 | 语文 | 数学 | 英语 | 五门调整总分 | 总分排名 | |
---|---|---|---|---|---|---|---|---|---|
0 | 政治 | 吴淞中学 | 110203110** | 周** | 102.0 | 110.0 | 127.5 | 459.1 | 8 |
1 | 政治 | 吴淞中学 | 110203110** | 杨** | 102.0 | 101.0 | 114.5 | 452.7 | 15 |
2 | 政治 | 吴淞中学 | 110203110** | 赵** | 95.0 | 108.0 | 128.5 | 448.3 | 19 |
# 查看理科生数据
print(df_l.columns)
df_l.head(3)
学科 | 学校 | 准考证号 | 姓名 | 语文 | 数学 | 英语 | 加一调整分 | 五门总分 | 总分排名 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 物理 | 行知中学 | 110101410** | 秦** | 109.0 | 127.0 | 123.5 | 117 | 494.9 | 38 |
1 | 物理 | 行知中学 | 110101410** | 王** | 98.5 | 103.5 | 128.5 | 111 | 461.3 | 189 |
2 | 物理 | 行知中学 | 110101410** | 金** | 102.0 | 135.0 | 123.0 | 127 | 507.0 | 21 |
# 查看数据格式
# 是否需要转换
df_l.dtypes
df_w.dtypes
# 修改文科生列名
df_w = df_w.rename(columns = {
'五门调整总分':'五门总分'})
df_w.head()
学科 | 学校 | 准考证号 | 姓名 | 语文 | 数学 | 英语 | 五门总分 | 总分排名 | |
---|---|---|---|---|---|---|---|---|---|
0 | 政治 | 吴淞中学 | 110203110** | 周** | 102.0 | 110.0 | 127.5 | 459.1 | 8 |
1 | 政治 | 吴淞中学 | 110203110** | 杨** | 1 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。