赞
踩
import pandas as pd
getdata=pd.read_excel('C:/文件夹索引/文件名.xlsx',
sheet_name='工作表sheet的名字')
sheet_name不设置参数,就默认第一个工作表,同时也可设置工作表的位置,读取第5个工作表可以设置为=4
如果对获取工作表其中的某列或者多列,可以使用usecols参数,比如读取第5个工作表的第2列到第5列
import pandas as pd
getdata=pd.read_excel(r'C:/文件夹索引/文件名.xlsx',
sheet_name='工作表sheet的名字',
sheet_name=4,
usecols=[i for i in range (1,6)])
usecols参数也可以设置成列的索引字母,比如usecols=“B,D:E”,可以获取第1和3到5列,同时设置参数index_col=1,把第二列当作索引,代码及输出结果为:
getdata=pd.read_excel(r'C:/文件夹索引/文件名.xlsx',
sheet_name='工作表sheet的名字',
sheet_name=4,
usecols="A,C:E",
index_col=1)
print(Getdata)
如果不想获取全部行数,如获取前5行可以设置参数nrows=5,同时跳过第2行到第4行,可以设置参数skiprows=[i for i in range(2,5)],或者skiprows=[2,3,4]
getdata=pd.read_excel(r'C:/文件夹索引/文件名.xlsx',
sheet_name='工作表sheet的名字',
skiprows=[2,3,4],
nrows=5)
print(Getdata)
这里应当注意,设置的nrows是总共要获取多少行,如果设置skiprows跳过一定数量行后,将在之后行里继续获取,直到补足nrows所要获取的行数。
def AutoDownload(ag):
list = []
EX = load_workbook(ag) # 打开Excel
sheet = EX['SheetJS'] # 定位表单
maxrow = int(format(sheet.max_row)) # 表单的最大行数
maxcol = int(format(sheet.max_column)) # 表单的最大列数
for i in range(1, maxrow + 1, 1):
data = sheet.cell(i, 1).value # 取出第i行第一列的数据
if data.startswith("Z"): # 以Z开头的数据
list.append(data)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。