当前位置:   article > 正文

python读写excel利器:xlwings从入门到精通

xlwings

python读写excel利器:xlwings 从入门到精通

目录

  • 安装和使用
    • 基础操作
        • 操作工作簿
        • 操作工作表
        • 读取单元格
        • 写入(单元格赋值)
        • range的操作(range常用的api)
            • 写入一行或一列Excel数据(函数式)
          • 使用range(\'A1\').api.AddComment(\'comments\')给单元格加注释
    • 格式设置
        • 设置单元格大小
        • 设置单元格 字体格式
        • 设置边框
    • 单元格操作
        • 合并拆分单元格
        • 插入 、删除 一行
        • 插入 、删除 一列
        • 排序,删除重复值
        • 删除重复值使用方法:
        • 插入、读取公式
        • 同个表格复制、粘贴
        • 跨表格复制、粘贴
    • 关闭文件
    • 其它功能
    • 踩过的坑
        • 解决xlwings写入长数字型字符串时变成科学计数法的问题
    • 参考资料:


xlwings简介:
python操作Excel的模块,网上提到的模块大致有:xlwings、xlrd、xlwt、openpyxl等,
他们提供的功能归纳起来有两种:

一、用python读写Excel文件,实际上就是读写有格式的文本文件,操作excel文件和操作text、csv文件没有区别,Excel文件只是用来储存数据。
二、除了操作数据,还可以调整Excel文件的表格宽度、字体颜色等。

xlwings和目前流行的其它xlsxwriter, openpyxl的区别:

特点:

  • xlwings能够非常方便的读写Excel文件中的数据,并且能够进行单元格格式的修改
  • 可以和matplotlib以及pandas无缝连接
  • 可以调用Excel文件中VBA写好的程序,也可以让VBA调用用Python写的程序。
  • 开源免费,一直在更新

安装和使用

  1. pip install xlwings
  2. conda install xlwings
  3. conda install -c conda-forge xlwings

xlwings中文文档
https://www.kancloud.cn/gnefnuy/xlwings-docs/1127450

英文文档:
https://docs.xlwings.org/en/stable/quickstart.html

excel基本结构分为 Application ——> Workbooks ——> Worksheets ——> Range.
即应用程序 ——> 工作簿 ——> 工作表 ——> 单元格。

在xlwings中

  • Excel程序用App来表示,多个Excel程序集合用Apps表示;
  • 单个工作簿用Book表示,工作簿集合用Books表示;
  • 单个工作表用Sheet表示,工作表集合用Sheets表示;
  • 区域用Range表示,既可以是一个单元格,也可以是一片单元格区域。

明确几个概念:

  1. 新建:创建一个不存在的工作薄或者工作表
  2. 打开:打开一个已经存在的工作薄
  3. 引用:就是告诉程序,你要操作哪个对象。比如你打开了A、B、C三个工作薄,现在你想操作B工作薄,就要先引用B
  4. 激活:我们可以同时打开多个工作薄,但是一次只能操作一个工作簿,我们正在操作的这个工作薄称为当前活动工作薄,激活的意思就是将某一个对象(工作薄或工作表等)变成当前活动对象

基础操作

  1. import xlwings as xw
  2. app = xw.App(visible=True, add_book=False)
  3. app.display_alerts = False # 关闭一些提示信息,可以加快运行速度。 默认为 True
  4. app.screen_updating = True # 更新显示工作表的内容。默认为 True。关闭它也可以提升运行速度。
  5. wb = app.books.add()
  6. sht = wb.sheets.active
操作工作簿
  1. # wb = app.books.add() # 新建工作簿。
  2. # wb = app.books.open(r\'file_path\') # 打开现有的工作簿
  3. # wb = app.books.active # 获取当前活动的工作簿
操作工作表
  1. sht = wb.sheets.active # 获取当前活动的工作表
  2. sht = wb.sheets[0] # 按索引获取工作表
  3. sht = wb.sheets[\'Sheet1\'] # 按表名获取工作表
  4. sht1 = wb.sheets.add() # 新建工作表,默认新建的放在最前面。
  5. sht1 = wb.sheets.add(\'新建工作表\', after=sht) # 新建工作表,放在sht工作表后面。
读取单元格
  1. cell1 = sht.range(\'cell1\')
  2. # 获取 cell1 中的值
  3. v = cell1.value
  4. # 也可以根据行列号读取
  5. cell1_value = sht.range(3,2).value
  6. # 读取一段区间内的值
  7. a1_c4_value = sht.range(\'a1:c4\').options(ndim=2).value # 加上 option 读取二维的数据
  8. a1_c4_value = sht.range((1,1),(4,3)).options(ndim=2).value # 和上面读取的内容一样。
写入(单元格赋值)
  1. sht.range(3,2).value = \'welcome\'
  2. sht.range(\'A1\').value=[1,2,3]
  3. # 将A1,B1,C1单元格的值存入list1列表中
  4. list1=sht.range(\'A1:C1\').value
  5. # 将123分别写入了A1,A2,A3单元格中
  6. sht.range(\'A1\').options(transpose=True).value=[1,2,3]
  7. # 将A1,A2,A3单元格中值存入list1列表中
  8. list1=sht.range(\'A1:A3\').value

前面操作的是单个单元格,接下来我们来操作一行或一列

sheet.range(\'A1\').value = [1, 2, 3, 4, 5]  #向 A1:E1 写入数据print(sheet.range(\'A1:E1\').value)   

xlwings 还提供了另外一种更加方便的方式来操作一个区域块,通过 expand 或 options 中的 expand 参数,expand 使用的是当前已获取的区域对象,而 options 中的 expand 参数在调用时才计算区域对象,推荐使用 options 中的 expand 参数,是你可以在更改区域后及时获取区域的变化。下面的代码,可以清楚的表达两种方式的不同。

  1. sheet.range(\'A1\').value = [[1,2], [3,4]]
  2. rng1 = sheet.range(\'A1\').expand(\'table\')
  3. rng2 = sheet.range(\'A1\').options(expand=\'table\')
  4. print(rng1.value)
  5. # [[1.0, 2.0], [3.0, 4.0]]
  6. print(rng2.value)
  7. # [[1.0, 2.0], [3.0, 4.0]]
  8. sheet.range(\'A3\').value = [5, 6]
  9. print(rng1.value)
  10. # [[1.0, 2.0], [3.0, 4.0]]
  11. print(rng2.value)
  12. # [[1.0, 2.0], [3.0, 4.0], [5.0, 6.0]]

举例(二维数据写入):

  1. # 将a1,a2,a3输入第一列,b1,b2,b3输入第二列
  2. list1=[[‘a1’,\'a2\',\'a3\'],[\'b1\',\'b2\',\'b3\']]
  3. sht.range(\'A1\').value=list1

  1. # 将A1:B3的值赋给二维列表list1
  2. list1=sht.range(\'A1:B3\').value

Excel中区域的选取表格(按行或按列选取)

  1. # 选取第一列
  2. rng=sht. range(\'A1\').expand(\'down\')
  3. rng.value=[\'a1\',\'a2\',\'a3\']
  4. # 选取第一行
  5. rng=sht.range(\'A1\').expand(\'right\')
  6. #rng=[\'a1\',\'b1\']

  1. # 选取表格
  2. rng.sht.range(\'A1\').expand(\'table\')
  3. rng.value=[[\'a1\',\'a2\',\'a3\'],[\'b1\',\'b2\',\'b3\']]

range的操作(range常用的api)
  1. # 引用当前活动工作表的单元格
  2. rng=xw.Range(\'A1\')
  3. # 加入超链接
  4. # rng.add_hyperlink(r\'www.baidu.com\',\'百度\',‘提示:点击即链接到百度\')
  5. # 取得当前range的地址
  6. rng.address
  7. rng.get_address()
  8. # 清除range的内容
  9. rng.clear_contents()
  10. # 清除格式和内容
  11. rng.clear()
  12. # 取得range的背景色,以元组形式返回RGB值
  13. rng.color
  14. # 设置range的颜色
  15. rng.color=(255,255,255)
  16. # 清除range的背景色
  17. rng.color=None
  18. # 获得range的第一列列标
  19. rng.column
  20. # 返回range中单元格的数据
  21. rng.count
  22. # 返回current_region
  23. rng.current_region
  24. # 返回ctrl + 方向
  25. rng.end(\'down\')
  26. # 获取公式或者输入公式
  27. rng.formula=\'=SUM(B1:B5)\'
  28. # 数组公式
  29. rng.formula_array
  30. # 获得单元格的绝对地址
  31. rng.get_address(row_absolute=True, column_absolute=True,include_sheetname=False, external=False)
  32. # 获得列宽
  33. rng.column_width
  34. # 返回range的总宽度
  35. rng.width
  36. # 获得range的超链接
  37. rng.hyperlink
  38. # 获得range中右下角最后一个单元格
  39. rng.last_cell
  40. # range平移
  41. rng.offset(row_offset=0,column_offset=0)
  42. #range进行resize改变range的大小
  43. rng.resize(row_size=None,column_size=None)
  44. # range的第一行行标
  45. rng.row
  46. # 行的高度,所有行一样高返回行高,不一样返回None
  47. rng.row_height
  48. # 返回range的总高度
  49. rng.height
  50. # 返回range的行数和列数
  51. rng.shape
  52. # 返回range所在的sheet
  53. rng.sheet
  54. #返回range的所有行
  55. rng.rows
  56. # range的第一行
  57. rng.rows[0]
  58. # range的总行数
  59. rng.rows.count
  60. # 返回range的所有列
  61. rng.columns
  62. # 返回range的第一列
  63. rng.columns[0]
  64. # 返回range的列数
  65. rng.columns.count
  66. # 所有range的大小自适应
  67. rng.autofit()
  68. # 所有列宽度自适应
  69. rng.columns.autofit()
  70. # 所有行宽度自适应
  71. rng.rows.autofit()
写入一行或一列Excel数据(函数式)

注意点:这里的sheet参数必须是已经存在的sheet表,不能新建

  1. import xlwings as xw
  2. def write_col(io, sheet, col=\'A1\', data=None):
  3. """
  4. 写入一列数据
  5. :param io: Excel文件
  6. :param sheet: sheet,int或者str类型
  7. :param col: 哪一列,如:\'A1\'
  8. :param data: 要写入的数据,list类型
  9. :return:
  10. """
  11. wb = xw.Book(io)
  12. if isinstance(sheet, str):
  13. sht = wb.sheets(sheet)
  14. else:
  15. sht = wb.sheets[sheet]
  16. sht.range(col).options(transpose=True).value = data
  17. wb.save()
  18. wb.app.quit()
  19. 一次写多列
  20. 注意点:此方法所需的data参数必须是list嵌套,如:[[1, 9], [2, 8], [3, 7], [4, 6]],并且里面的每个list的长度必须一致
  21. def write_col(io, sheet, col=\'A1\', data=None):
  22. """
  23. 写入多列数据
  24. :param io: Excel文件
  25. :param sheet: sheet,int或者str类型
  26. :param row: 从哪一列开始写入,如:\'A1\'
  27. :param data: 要写入的数据,嵌套list类型
  28. :return:
  29. """
  30. wb = xw.Book(io)
  31. if isinstance(sheet, str):
  32. sht = wb.sheets(sheet)
  33. else:
  34. sht = wb.sheets[sheet]
  35. sht.range(col).value = data
  36. wb.save()
  37. wb.app.quit()

写入效果如下:

写入行,一次写一行
注意点:此方法所需的data参数是list类型,如:[1, 2, 3, 4]

  1. def write_row(io, sheet, row=\'A1\', data=None):
  2. """
  3. 写入一行数据
  4. :param io: Excel文件
  5. :param sheet: sheet,int或者str类型
  6. :param row: 哪一行,如:\'A1\'
  7. :param data: 要写入的数据,list类型
  8. :return:
  9. """
  10. wb = xw.Book(io)
  11. if isinstance(sheet, str):
  12. sht = wb.sheets(sheet)
  13. else:
  14. sht = wb.sheets[sheet]
  15. sht.range(row).value = data
  16. wb.save()
  17. wb.app.quit()
  18. 一次写多行
  19. 注意点:此方法所需的data参数必须是list嵌套,如:[[1, 2], [3, 4], [5, 6]],并且里面的每个list的长度必须一致
  20. def write_row(io, sheet, row=\'A1\', data=None):
  21. """
  22. 写入多行数据
  23. :param io: Excel文件
  24. :param sheet: sheet,int或者str类型
  25. :param col: 从哪一行开始写入,如:\'A1\'
  26. :param data: 要写入的数据,嵌套list类型
  27. :return:
  28. """
  29. wb = xw.Book(io)
  30. if isinstance(sheet, str):
  31. sht = wb.sheets(sheet)
  32. else:
  33. sht = wb.sheets[sheet]
  34. sht.range(row).options(transpose=True).value = data
  35. wb.save()
  36. wb.app.quit()
  37. 写入效果如下:

使用range(\'A1\').api.AddComment(\'comments\')给单元格加注释
  1. ws1 = wb.sheets.add(\'原始整理\')
  2. ws1.range(\'A1\').value = \'name_list_bank\'
  3. ws1.range(\'A1\').api.AddComment(\'该表是汇总大家的待授信银行机构名单\')
  4. ws1.range(\'A2\').options(transpose=True).value = sorted(name_list_bank)
  5. ws1.range(\'B1\').value = \'name_none_bank\'
  6. ws1.range(\'B1\').api.AddComment(\'该表是汇总数人的待授信非银行机构名单\')
  7. ws1.range(\'B2\').options(transpose=True).value = sorted(name_none_bank)

格式设置

使用xlwings模块进行excel表格操作时,难免会用到对单元格进行格式设置,比如常用到的对单元格设置为文本格式、日期时间格式、小数和百分数,下面列出常用:
使用range().api.NumberFormat = XXX即可修改格式

比如:

  1. range(\'A1\').api.NumberFormat = "@" #设置为文本格式
  2. range(\'A2\').api.NumberFormat = "0.0" #设置为小数格式
  3. range(\'A3\').api.NumberFormat = "yyyy-mm-dd" #设置为"-"连接的日期格式
  4. range(\'A4\').api.NumberFormat = "0%" #设置为百分比
设置单元格大小
  1. sht.autofit() # 自动调整单元格大小。注:此方法是在单元格写入内容后,再使用,才有效。
  2. sht.range(1,4).column_width = 5 # 设置第4列 列宽。(1,4)为第1行第4列的单元格
  3. sht.range(1,4).row_height = 20 # 设置第1行 行高
设置单元格 字体格式
  1. cell1.color = 255,200,255 # 设置单元格的填充颜色
  2. cell1.api.Font.ColorIndex = 3 # 设置字体的颜色,具体颜色索引见下方。
  3. cell1.api.Font.Size = 24 # 设置字体的大小。
  4. cell1.api.Font.Bold = True # 设置为粗体。
  5. cell1.api.HorizOntalAlignment= -4108 # -4108 水平居中。 -4131 靠左,-4152 靠右。
  6. cell1.api.VerticalAlignment = -4130 # -4108 垂直居中(默认)。 -4160 靠上,-4107 靠下, -4130 自动换行对齐。
  7. cell1.api.NumberFormat = "0.00" # 设置单元格的数字格式。
设置边框

  1. # Borders(9) 底部边框,LineStyle = 1 直线。
  2. cell1.api.Borders(9).LineStyle = 1
  3. cell1.api.Borders(9).Weight = 3 # 设置边框粗细。
  4. # Borders(7) 左边框,LineStyle = 2 虚线。
  5. cell1.api.Borders(7).LineStyle = 2
  6. cell1.api.Borders(7).Weight = 3
  7. # Borders(8) 顶部框,LineStyle = 5 双点划线。
  8. cell1.api.Borders(8).LineStyle = 5
  9. cell1.api.Borders(8).Weight = 3
  10. # Borders(10) 右边框,LineStyle = 4 点划线。
  11. cell1.api.Borders(10).LineStyle = 4
  12. cell1.api.Borders(10).Weight = 3
  13. # Borders(5) 单元格内从左上角 到 右下角。
  14. cell1.api.Borders(5).LineStyle = 1
  15. cell1.api.Borders(5).Weight = 3
  16. # Borders(6) 单元格内从左下角 到 右上角。
  17. cell1.api.Borders(6).LineStyle = 1
  18. cell1.api.Borders(6).Weight = 3

如果是一个区域的单元格,内部边框设置如下

  1. # # Borders(11) 内部垂直边线。
  2. # cell1.api.Borders(11).LineStyle = 1
  3. # cell1.api.Borders(11).Weight = 3
  4. #
  5. # # Borders(12) 内部水平边线。
  6. # cell1.api.Borders(12).LineStyle = 1
  7. # cell1.api.Borders(12).Weight = 3

单元格操作

合并拆分单元格
  1. sht.range(\'C8:D8\').api.merge() # 合并单元格 C8 到 D8
  2. sht.range(\'C8:D8\').api.unmerge() # 拆分单元格。
插入 、删除 一行
  1. sht1.range(\'a3\').api.EntireRow.Delete() # 会删除 ’a3‘ 单元格所在的行。
  2. sht1.api.Rows(3).Insert() # 会在第3行插入一行,原来的第3行下移。
插入 、删除 一列
  1. sht1.range(\'c2\').api.EntireColumn.Delete() # 会删除 ’c2‘ 单元格所在的列。
  2. sht1.api.Columns(3).Insert() # 会在第3列插入一列,原来的第3列右移。(也可以用列的字母表示)

选择sheet页面最右下角的单元格,获取最大行数,和列数

  1. # 区别 expand(), expand()只选中与之连续的单元格。
  2. cell = sht1.used_range.last_cell
  3. rows = cell.row
  4. columns = cell.column
  5. # cell = sht1.range("a1").expand("down")
  6. # max_rows = cell.rows.count # 获取最大行数
排序,删除重复值

排序使用方法:
1、选择需要排序的区域。这里用 \'a2\' 是因为排序的数据送从第二行开始的,第一行是标题,不应该参与排序。
2、选择按那一列进行排序 Key1=sht.range(\'c2\').api, 这里选择的是按 第 C 列排序,所以这里选择 c1 和 c2 都可以。
3、Order1=1 为升序,2为降序。

sht1.range(\'a2\',(rows,columns)).api.Sort(Key1=sht.range(\'c2\').api, Order1=1)
删除重复值使用方法:
  1. # RemoveDuplicates(3) 为按第3列内容进行删除重复项。
  2. sht1.range(\'a2\',(rows,columns)).api.RemoveDuplicates(3)
插入、读取公式
  1. sht1.range(\'d1\').formula = \'=sum(e1+f1)\' # 插入公式
  2. print(sht1.range(\'d1\').formula)
同个表格复制、粘贴
  1. # 复制 a2 到 a6 之间单元格的值,粘贴到\'a15\'
  2. sht.range(\'a2\',\'a6\').api.Copy(sht.range(\'a15\').api)
跨表格复制、粘贴
  1. my_values = sht_1.range(\'a2:d4\').options(ndim=2).value # 读取二维的数据
  2. sht_2.range(\'a1\').value = my_values

关闭文件

  1. wb.save()
  2. #wb.close()
  3. #app.quit()

其它功能

清除单元格内容和格式 sheet.range(\'A1\').clear()
单元格的列标 sheet.range(\'A1\').column
单元格的行标 sheet.range(\'A1\').row
单元格的行高 sheet.range(\'A1\').row_height
单元格的列宽 sheet.range(\'A1\').column_width
列宽自适应 sheet.range(\'A1\').columns.autofit()
行高自适应 sheet.range(\'A1\').rows.autofit()
单元格背景色(RGB) sheet.range(\'A1\').color=(34,139,34)
清除单元格颜色 sheet.range(\'A1\').color=None
输入公式,相应单元格会出现计算结果 sheet.range(\'A1\').formula=\'=SUM(A1:E1)
获取单元格公式 sheet.range(\'A1\').formula_array

踩过的坑

解决xlwings写入长数字型字符串时变成科学计数法的问题

解决要点:要先把要设置的那一列,设置为文本格式,再给那个区域赋值(次序倒过来是不行的)

  1. sht = wb.sheets.add(\'买入清单\')
  2. sht.range(\'B:B\').api.NumberFormat ="@"
  3. sht.range(\'A1\').value = df_gz_buy
  4. sht.autofit(\'c\')
  5. #或者写成:
  6. sht2 = wb.sheets.add(\'卖出清单\',after =sht)
  7. range2 = sht2.range(\'B:B\')
  8. range2.api.NumberFormat ="@"
  9. sht2.range(\'A1\').value = df_gz_sell
  10. sht2.autofit(\'c\')

参考资料:

官网:https://docs.xlwings.org/en/stable/
官网中文:https://docs.xlwings.org/zh_CN/latest/quickstart.html
国外视频教程(USD99)https://training.xlwings.org/p/xlwings
利用xlwings库对excel进行字体(font)、边框(border)、合并单元格(merge)等格式设置:http://www.dszhp.com/xlwings-format.html
不一样的xlwings用法:https://blog.csdn.net/lly1122334/article/details/99706504
10秒搞定Xlwings全套操作:https://zhuanlan.zhihu.com/p/237583143
Python操作Excel的Xlwings教程(1-5)(强烈推荐):
https://blog.csdn.net/th1522856954/article/details/107850947
https://blog.csdn.net/th1522856954/article/details/107923265
https://blog.csdn.net/th1522856954/article/details/108111058
https://blog.csdn.net/th1522856954/article/details/108269219

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/143805
推荐阅读
相关标签
  

闽ICP备14008679号