赞
踩
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Go语言开发知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
import pandas as pd
# 读取指定工作表的部分内容
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', skiprows=2, nrows=10)
上述代码将从名为Sheet1
的工作表中跳过前两行,并读取接下来的10行内容。通过调整skiprows
和nrows
参数的值,我们可以读取不同的工作表部分内容。
除了读取指定的行,有时我们还可能只对特定的列感兴趣。Pandas提供了usecols
参数来指定要读取的列。我们可以将列的索引或列名作为参数传递给usecols
来实现这一点。示例代码如下:
import pandas as pd
# 读取指定工作表的指定列
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols='A:C')
上述代码将只读取名为A
、B
和C
的列,并将其存储在df
变量中。通过调整usecols
参数的值,我们可以读取不同的列。
默认情况下,Pandas会使用Excel文件中的列名作为DataFrame的列名。但是,有时候我们可能想要自定义列名。Pandas提供了names
参数来实现这一点。我们可以将一个包含自定义列名的列表传递给names
参数。示例代码如下:
import pandas as pd
# 读取指定工作表的指定列,并指定列名
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols='A:C', names=['Column1', 'Column2', 'Column3'])
上述代码将读取名为A
、B
和C
的列,并将其存储在df
变量中。同时,使用自定义的列名Column1
、Column2
和Column3
。通过调整usecols
参数的值和names
参数的值,我们可以读取不同的列,并指定不同的列名。
假设我们有一个包含日期列的Excel文件,并且我们想要只读取日期大于等于某个特定日期的数据。我们可以使用Pandas中的parse_dates
参数将日期列解析为日期类型,并使用date_parser
参数指定日期解析器。示例代码如下:
import pandas as pd
# 定义日期解析器
def dateparse(date):
return pd.to_datetime(date)
# 读取具有日期列的Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', parse_dates=['Date'], date_parser=dateparse)
# 选择日期大于等于2022-01-01的数据
df_filtered = df[df['Date'] >= '2022-01-01']
在上述代码中,我们首先定义了一个名为dateparse
的函数,将日期字符串解析为Pandas的日期类型。然后,我们使用parse_dates
参数指定要解析的日期列为Date
列,并使用date_parser
参数传递dateparse
函数。最后,我们选择日期大于等于2022-01-01的数据,存储在df_filtered
变量中。
如果我们的Excel文件包含多个工作表,并且我们想要同时读取多个工作表的内容,可以使用sheet_name
参数传递一个列表来指定要读取的工作表。示例代码如下:
import pandas as pd
# 读取多个工作表的内容
df1 = pd.read_excel('file.xlsx', sheet_name=['Sheet1', 'Sheet2'])
# 打印工作表Sheet1的内容
print(df1['Sheet1'])
# 打印工作表Sheet2的内容
print(df1['Sheet2'])
在上述代码中,我们使用sheet_name
参数传递一个包含要读取的工作表名的列表。然后,我们将读取的工作表内容存储在一个字典中,其中键是工作表名。我们可以通过访问字典中的键来获取特定工作表的内容。
有时候我们可能需要将读取的Excel文件内容进行处理后,再写入到一个新的Excel文件中。Pandas提供了to_excel()
方法来实现这一点。示例代码如下:
import pandas as pd
# 读取Excel文件内容
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 对数据进行处理
# 将处理后的数据写入新的Excel文件
df.to_excel('new\_file.xlsx', index=False)
在上述代码中,我们首先使用read_excel()
方法读取Excel文件的内容,并将其存储在df
变量中。然后,我们对数据进行处理。最后,使用to_excel()
方法将处理后的数据写入一个名为new_file.xlsx
的新Excel文件中。index=False
参数用于禁止将索引列写入Excel文件中。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。