赞
踩
import pandas as pd
pad = pd.Dataframe() # 创建一个空的DataFrame
path = r'D\Program\xxx.xlsx'
data = pd.read_excel(path, .......) # .....表示其他参数,具体看解析
⭐通过read_excel()读取excel后返回DataFrame或者由DataFrame构成的字典⭐
除了要传入文件路径外 一般还会传入sheet相关参数来读取数据
sheet_name = str、int、list、None均可 Default = 0
header = int、list、None Default = 0
该参数用于指定DataFrame数据的列标签,默认为0,即把sheet页第一行看作每一列的表头(列标签)
该参数用于指定 DataFrame 的列名,传入字符串列表
⭐一般配合header=None使用(否则会默认把第1行当作列名,然后names参数又重新定义列名,即names参数会覆盖header指定的内容,这样会导致sheet页的第1行数据丢失)
pd.read_excel(path, sheet_name = 1, header = None, names = ['lst1','lst2'], usecols=[0,1])
usecols= str、int、list、None Default = None
skiprows = list、int、callable
nrows = 4表示只读取表格前5行数据,同样注意header取值
较为复杂的excel数据 一般该参数dtype = str
通过列标签可以直接索引DF的列数据,语法如下:
DataFrame['column_label']
通过pandas将excel中的数据以dtype的形式读取到DataFrame中后可通过loc索引读取单元格数据
⭐定位.loc的特殊用法
import pandas as pd
path = r'D\Program\xxx.xlsx'
data = pd.read_excel(path,sheet_name=8, dtype=str)
#默认header=0占用一行 实际dataframe是从【表格】第二行开始读取的loc[4]对应第六行
cellvalue_str = data.loc[4][2] # 读取第六行第三个元素的单元格数据、
#将不同数据读取出来放在两个列表中 通过zip和dict将数据打包成字典以便后续使用
# **也可以通过data.at[4,'Name列标签'] = 'A' 可以访问单个元素进行修改**
DataFrame.loc 是 Pandas 库中用于按位置标签(行或列的名称)选择行和列的方法。
其语法如下:
df.loc[row_indexer, column_indexer]
其中 row_indexer 和 column_indexer 可以是标签、标签列表、标签切片或布尔数组。
# 选择单个元素
df.loc[row_label, column_label]
df.loc[row_label][colum_index]
# 选择多行元素
df.loc[start_row_label:end_row_label, :]
df.loc[start_row_label:end_row_label]
df.loc[<list>,:] # 或者df.loc[<list>]默认所有列都选
# 选择多列元素
df.loc[:, start_column_label:end_column_label]
# 选择子集元素 row_indexer column_indexer 表示两个索引列表
df.loc[row_indexer, column_indexer]
【示例】选择单个元素
import pandas as pd
df = pd.DataFrame(
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。