当前位置:   article > 正文

用Python读写操作Excel数据!_python xls

python xls

对比其它编程语言,我们都知道Python最大的优势是代码简单,有丰富的第三方开源库供开发者使用。伴随着近几年数据分析的热度,Python也成为最受欢迎的编程语言之一。而对于数据的读取和存储,对于普通人来讲,除了数据库之外,最常见的就是微软的Excel。

2. 前期准备

2.1. 初识Excel

Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。

2.2. 格式区别

Excel中有xls和xlsx两种格式,它们之间的区别是:

  • 文件格式不同。xls是一个特有的二进制格式,其核心结构是复合文档类型的结构,而xlsx的核心结构是XML类型的结构,采用的是基于 XML的压缩方式,使其占用的空间更小。xlsx 中最后一个 x 的意义就在于此。

  • 版本不同。xls是Excel2003及以前版本生成的文件格式,而xlsx是Excel2007及以后版本生成的文件格式。

  • 兼容性不同。xlsx格式是向下兼容的,可兼容xls格式。

2.3. 库的使用

Python自带的模块中有针对xls格式的xlrd和xlwt模块,但这两个库仅仅是针对xls的操作,当我们要操作xlsx格式文件时,则需要使用到openpyxl第三方库。

2.4. 整体思路

当使用以上几个模块的时候,从理论上我们就可以完全操作不同格式的Excel的读和写,很多人就疑惑,那这篇文章的作用是什么?我们直接学习对应的这三个模块不就好了吗?

答案就是:虽然这几个库已经把Excel的文件、表、行、列的概念完全转换为Python中的对象,但每次操作都需要遍历每一个单元格,甚至很多时候我们要花费大量的时间在思考循环单元格的边界上,这本身就是在重复造轮子,因此我花了半天时间整理了以下六个函数。

3. 代码展示

3.1. xlz格式

3.1.1. 读取xls格式文件
def read_xls_excel(url,index):  
    '''  
    读取xls格式文件  
    参数:  
        url:文件路径  
        index:工作表序号(第几个工作表,传入参数从1开始数)  
    返回:  
        data:表格中的数据  
    '''  
    # 打开指定的工作簿  
    workbook = xlrd.open_workbook(url)  
    # 获取工作簿中的所有表格  
    sheets = workbook.sheet_names()  
    # 获取工作簿中所有表格中的的第 index 个表格  
    worksheet = workbook.sheet_by_name(sheets[index-1])  
    # 定义列表存储表格数据  
    data = []  
    # 遍历每一行数据  
    for i in range(0, worksheet.nrows):  
        # 定义表格存储每一行数据  
        da = []  
        # 遍历每一列数据  
        for j in range(0, worksheet.ncols):  
            # 将行数据存储到da列表  
            da.append(worksheet.cell_value(i, j))  
        # 存储每一行数据  
        data.append(da)  
    # 返回数据  
    return data  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
3.1.2. 写入xls格式文件
def write_xls_excel(url,sheet_name,two_dimensional_data):  
  '''  
    写入xls格式文件  
    参数:  
        url:文件路径  
        sheet_name:表名  
        two_dimensional_data:将要写入表格的数据(二维列表)  
    '''  
    # 创建工作簿对象  
    workbook = xlwt.Workbook()  
    # 创建工作表对象  
    sheet = workbook.add_sheet(sheet_name)  
    # 遍历每一行数据  
    for i in range(0,len(two_dimensional_data)):  
        # 遍历每一列数据  
        for j in range(0,len(two_dimensional_data[i])):  
            # 写入数据  
            sheet.write(i,j,two_dimensional_data[i][j])  
    # 保存  
    workbook.save(url)  
    print(写入成功)  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
3.1.3. 追加写入xls格式文件
def write_xls_excel_add(url, two_dimensional_data, index):  
    '''  
    追加写入xls格式文件  
    参数:  
        url:文件路径  
        two_dimensional_data:将要写入表格的数据(二维列表)  
        index:指定要追加的表的序号(第几个工作表,传入参数从1开始数)  
    '''  
    # 打开指定的工作簿  
    workbook = xlrd.open_workbook(url)  
    # 获取工作簿中的所有表格  
    sheets = workbook.sheet_names()  
    # 获取指定的表  
    worksheet = workbook.sheet_by_name(sheets[index-1])  
    # 获取表格中已存在的数据的行数  
    rows_old = worksheet.nrows  
    # 将xlrd对象拷贝转化为xlwt对象  
    new_workbook = copy(workbook)  
    # 获取转化后工作簿中的第index个表格  
    new_worksheet = new_workbook.get_sheet(index-1)  
    # 遍历每一行数据  
    for i in range(0, len(two_dimensional_data)):  
        # 遍历每一列数据  
        for j in range(0, len(two_dimensional_data[i])):  
            # 追加写入数据,注意是从i+rows_old行开始写入  
            new_worksheet.write(i+rows_old, j, two_dimensional_data[i][j])  
    # 保存工作簿  
    new_workbook.save(url)  
    print(追加写入成功)  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30

3.2. xlsx格式

3.2.1. 读取xlsx格式文件
def read_xlsx_excel(url, sheet_name):  
    '''  
    读取xlsx格式文件  
    参数:  
        url:文件路径  
        sheet_name:表名  
    返回:  
        data:表格中的数据  
    '''  
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象  
    workbook = openpyxl.load_workbook(url)  
    # 根据指定表名获取表格并得到对应的sheet对象  
    sheet = workbook[sheet_name]  
    # 定义列表存储表格数据  
    data = []  
    # 遍历表格的每一行  
    for row in sheet.rows:  
        # 定义表格存储每一行数据  
        da = []  
        # 从每一行中遍历每一个单元格  
        for cell in row:  
            # 将行数据存储到da列表  
            da.append(cell.value)  
        # 存储每一行数据  
        data.append(da)  
    # 返回数据  
    return data  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
3.2.2. 写入xlsx格式文件
def write_xlsx_excel(url, sheet_name, two_dimensional_data):  
    '''  
    写入xlsx格式文件  
    参数:  
        url:文件路径  
        sheet_name:表名  
        two_dimensional_data:将要写入表格的数据(二维列表)  
    '''  
    # 创建工作簿对象  
    workbook = openpyxl.Workbook()  
    # 创建工作表对象  
    sheet = workbook.active  
    # 设置该工作表的名字  
    sheet.title = sheet_name  
    # 遍历表格的每一行  
    for i in range(0, len(two_dimensional_data)):  
        # 遍历表格的每一列  
        for j in range(0, len(two_dimensional_data[i])):  
            # 写入数据(注意openpyxl的行和列是从1开始的,和我们平时的认知是一样的)  
            sheet.cell(row=i + 1, column=j + 1, value=str(two_dimensional_data[i][j]))  
    # 保存到指定位置  
    workbook.save(url)  
    print(写入成功)  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
3.2.3. 追加写入xlsx格式文件
def write_xlsx_excel_add(url, sheet_name, two_dimensional_data):  
    '''  
    追加写入xlsx格式文件  
    参数:  
        url:文件路径  
        sheet_name:表名  
        two_dimensional_data:将要写入表格的数据(二维列表)  
    '''  
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象  
    workbook = openpyxl.load_workbook(url)  
    # 根据指定表名获取表格并得到对应的sheet对象  
    sheet = workbook[sheet_name]  
    for tdd in two_dimensional_data:  
        sheet.append(tdd)  
    # 保存到指定位置  
    workbook.save(url)  
    print(追加写入成功)  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

4. 结果测试

4.1. 读取测试

先准备两个Excel文件,如图所示

其内容如下:

测试代码:

输出结果:

结论:表明读取并没有问题!!!接下来测试写入

4.2. 写入测试

测试代码:

结果输出:

看到数据被覆盖了!!!接下来在上面修改后的数据的基础上测试追加写入

4.3. 追加写入测试

测试代码:

结果输出:

追加也没有问题!!

5. 总结

我一直认为数据分析就应该以数据为主,而不应该把大量的代码花费在设计Excel表格的样式上,这样多少就有点主客颠倒的意思了。总之,希望这篇文章对正在学习Python的你有一定的帮助,如果对你有帮助的话,不妨点个赞和收藏吧!

以上就是“用Python读写操作Excel数据!”的全部内容,希望对你有所帮助。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

img

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

img

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

img

五、Python练习题

检查学习结果。

img

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

img

最后祝大家天天进步!!

上面这份完整版的Python全套学习资料已经上传至CSDN官方,朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/817005
推荐阅读
相关标签
  

闽ICP备14008679号