当前位置:   article > 正文

Python--高级编程_python高级编程

python高级编程

一、正则表达式(Ctrl+单击查看函数结构)

1、正则引入

正则表达式是一种用于匹配和处理文本的强大工具。它可以帮助开发者在文本中查找、替换和提取特定模式的内容。以下是正则表达式的一些常见用途:

  1. 模式匹配:正则表达式可以用来检查一个字符串是否符合某种特定的模式。例如,可以使用正则表达式来验证一个邮箱地址或者检查一个字符串是否是一个有效的日期格式。

  2. 文本搜索和替换:正则表达式可以在文本中搜索和替换特定的模式。例如,可以使用正则表达式来查找所有包含特定单词的句子,并将其替换为其他内容。

  3. 数据提取:正则表达式可以从文本中提取特定的数据。例如,可以使用正则表达式从一个包含电话号码的字符串中提取出所有的电话号码。

  4. 数据验证:正则表达式可以用来验证用户输入的数据是否符合特定的格式要求。例如,可以使用正则表达式来验证一个密码是否包含特定的字符和长度要求。

  1. '''
  2. 需求:
  3. 封装函数,判断手机号码是否合法?
  4. a.长度是11位
  5. b.数字1开头
  6. c.手机号码的组成全部是数字
  7. '''
  8. def checkPhone(tel):
  9. if len(tel) != 11:
  10. return "手机号码的长度不符合要求"
  11. if tel[0] != "1":
  12. return "手机号码不是1开头"
  13. if not tel.isdigit():
  14. return "手机号码的组成不是全部是数字"
  15. return "合法的手机号码"
  16. # 2. 使用正则表达式验证手机号码是否合法
  17. import re # 导入正则表达式相关的模块
  18. result = re.search('^1\d{10}$','18617767027')
  19. # print(result)
  20. if result:
  21. print('手机号码合法')
  22. else:
  23. print('手机号码不合法')

2、正则常用函数

  1. import re
  2. # \d: 表示 0-9之间的任意数字
  3. # +: 表示前面的内容可以出现1次或者多次
  4. '''
  5. 1.re.match(要匹配的正则表达式,要验证的字符串,可选参数(修饰符)) 匹配开头
  6. 作用: 匹配字符串是否以指定的正则内容开头,若匹配成功,返回符合要求的对象,若匹配失败,返回None
  7. '''
  8. print(re.match('\d+', '123dsdg678',flags=10)) # <re.Match object; span=(0, 3), match='123'>
  9. print(re.match('\d+', 'dshjhj123dsdg678')) # None,不是数字开头
  10. e = '113333'
  11. b = '11'
  12. print(re.match(b, e,re.I)) # 检验e是否以b开头
  13. '''
  14. 2.re.search(正则表达式,要验证的字符串,可选参数(修饰符)) 包含
  15. 作用: 匹配字符串是否包含指定的正则内容,若匹配成功,返回对象,若匹配失败,返回None
  16. '''
  17. print(re.search('\d+', '123dsdg678')) # <re.Match object; span=(0, 3), match='123'>
  18. print(re.search('\d+', 'dshjhj123dsdg678')) # <re.Match object; span=(6, 9), match='123'>
  19. '''
  20. 3.re.findall(正则表达式,要验证的字符串) 获取包含的内容
  21. 作用: 使用正则表达式获取匹配成功的数据,返回的是一个列表
  22. '''
  23. print(re.findall('\d+', 'hsjdhsj134243dshkdhks9877dhsjh5665dsd54778')) # ['134243', '9877', '5665', '54778']

3、 正则匹配规则

  1. import re
  2. '''
  3. 以下匹配规则只能匹配一个字符
  4. . : 表示除了换行符以外的所有的字符
  5. [] :表示的是一个范围
  6. - : 表示的是一个区间
  7. [0123456789]: []表示集合,表示匹配[]中的任意一个字符
  8. [a-z]: 匹配任意的一个小写字母
  9. [A-Z]: 匹配任意的一个大写字母
  10. [0-9a-zA-Z]:匹配任意的数字和字母
  11. [^0-9]: 匹配任意的一个非数字字符
  12. \d: 表示匹配0-9之间任意的数字 等同于 [0-9]
  13. \D: 表示对\d进行取反,匹配任意的非数字字符 等同于 [^0-9]
  14. \w: 表示匹配任意的数字 字母 和下划线 等同于 [0-9a-zA-Z_]
  15. \W: 表示对\w进行取反,匹配数字 字母 下划线之外任意字符
  16. \s: 表示匹配任意的空白符(空格 换行 回车 制表符) 等同于[\r\t\n\f]
  17. \S: 表示对\s进行取反
  18. print(re.search("he[0-9]llo","he87llo")) # None 因为 [0-9]只能匹配一个数字
  19. print(re.search("he[0-9]llo","he8llo")) # <re.Match object; span=(0, 6), match='he8llo'>
  20. print(re.search("98[a-z]76","98f76")) # <re.Match object; span=(0, 5), match='98f76'>
  21. print(re.search("98[A-Z]76","98H76")) # <re.Match object; span=(0, 5), match='98H76'>
  22. print(re.search("apple\d","apple9")) # <re.Match object; span=(0, 6), match='apple9'>
  23. print(re.search("8765\D","8765f")) # <re.Match object; span=(0, 5), match='8765f'>
  24. print(re.search("banana\D","banana5")) # None
  25. print(re.search("good\w","good4")) # <re.Match object; span=(0, 5), match='good4'>
  26. print(re.search("322\w","322k")) # <re.Match object; span=(0, 4), match='322k'>
  27. print(re.search("785\w","785_")) # <re.Match object; span=(0, 4), match='785_'>
  28. print(re.search("785\W","785@")) # <re.Match object; span=(0, 4), match='785@'>
  29. print(re.search("785\W","785s")) # None
  30. '''
  31. # 模式修正符: 主要是用于修饰正则表达式
  32. '''
  33. re.S:可以让正则表达式匹配换行 \n表示换行
  34. re.I: 可以让正则表达式忽略字母大小写
  35. print(re.search('shenzhen.','shenzhen875ds')) # <re.Match object; span=(0, 9), match='shenzhen8'>
  36. print(re.search('shenzhen.','shenzhen\n')) # None
  37. print(re.search('shenzhen.','shenzhen\n',re.S)) # <re.Match object; span=(0, 9), match='shenzhen\n'>
  38. print(re.search("98765[a-z]","98765asw")) # <re.Match object; span=(0, 6), match='98765a'>
  39. print(re.search("98765[a-z]","98765DGH")) # None
  40. print(re.search("98765[a-z]","98765DGH",re.I)) # <re.Match object; span=(0, 6), match='98765D'>
  41. '''
  42. # 匹配多个字符:
  43. '''
  44. ? :表示匹配前面的字符出现0次或者1次
  45. + :表示匹配前面的字符出现1次或者多次 贪婪模式
  46. * :表示匹配前面的字符出现0次或者多次 贪婪模式
  47. {} :表示匹配前面的字符可以出现指定的次数或者出现指定范围内的次数, 贪婪模式
  48. {4}: 表示前面的字符只能出现4次
  49. {4,9}:表示前面的字符可以出现4-9次
  50. {4,}: 表示前面的字符至少出现4次
  51. {,4}: 表示前面的字符最多可以出现4次
  52. '''
  53. print(re.search("face?book","facebook")) # <re.Match object; span=(0, 8), match='facebook'> e出现1次的情况
  54. print(re.search("face?book","facbook")) # <re.Match object; span=(0, 7), match='facbook'> e出现0次情况
  55. print(re.search("face+book","facebook")) # <re.Match object; span=(0, 8), match='facebook'> e出现1次的情况
  56. print(re.search("face+book","faceeeeeebook")) # <re.Match object; span=(0, 13), match='faceeeeeebook'> e出现多次的情况
  57. print(re.search("face*book","facbook")) # <re.Match object; span=(0, 7), match='facbook'> e出现0次的情况
  58. print(re.search("face*book","faceeeebook")) # <re.Match object; span=(0, 11), match='faceeeebook'> e出现多次的情况
  59. print(re.search("face{4}book","faceeeebook")) # <re.Match object; span=(0, 11), match='faceeeebook'> e出现4次的情况
  60. print(re.search("face{4}book","faceeeeeeebook")) # None e出现不是4次的情况
  61. print(re.search("face{4,9}book","faceeeeeeebook")) # <re.Match object; span=(0, 14), match='faceeeeeeebook'> e出现4-9次的情况
  62. print(re.search("face{4,9}book","faceeebook")) # None e出现不是4-9次的情况
  63. print(re.search("face{4,}book","faceeeeeebook")) # <re.Match object; span=(0, 13), match='faceeeeeebook'> e出现至少4次的情况
  64. print(re.search("face{,4}book","faceebook")) # <re.Match object; span=(0, 9), match='faceebook'> e最多出现4次的情况

4、 边界字符规则

  1. import re
  2. '''
  3. 1.边界符:
  4. ^: 行首匹配(以指定字符开头) 和 [^] 不是一个含义
  5. $: 行尾匹配(以指定字符结束)
  6. ^文本$: 表示精准匹配
  7. print(re.search('^world','world')) # <re.Match object; span=(0, 5), match='world'>
  8. print(re.search('^world','aworld')) # None
  9. print(re.search('world$','world')) # <re.Match object; span=(0, 5), match='world'>
  10. print(re.search('world$','worldsf')) # None
  11. print(re.search('^world$','world')) # <re.Match object; span=(0, 5), match='world'>
  12. print(re.search('^world$','wo12rlf3d')) # None
  13. '''
  14. '''
  15. 2.
  16. \ 表示转义字符,作用是让符号失去原有的意义
  17. . 在正则表达式表示匹配除了换行\n之外的任意字符, \.这个时候,这个.就是一个普通的符号了
  18. | 表示或者, 正则表达式1 | 正则表达式2 只要满足其中的一个正则表达式即可
  19. print(re.search('goog.le','googlle')) # <re.Match object; span=(0, 7), match='googlle'>
  20. print(re.search('goog\.le','goog.le')) # <re.Match object; span=(0, 7), match='goog.le'>
  21. print(re.search('cd|ef','123cd87878')) # <re.Match object; span=(3, 5), match='cd'>
  22. print(re.search('cd|ef','8765ef434')) # <re.Match object; span=(4, 6), match='ef'>
  23. '''
  24. '''
  25. 3.词边界(了解)
  26. \b: 匹配一个单词的边界,也就是单词和空格之间的位置
  27. \B: 对\b进行取反
  28. '''
  29. print(re.search(r'google\b',"123google hello world")) # <re.Match object; span=(3, 9), match='google'>
  30. print(re.search(r'google\B',"123google hello world")) # <re.Match object; span=(3, 9), match='google'> # None

5、正则函数

  1. import re
  2. '''
  3. 1.re.compile() 编译正则表达式,用于提高正则匹配的效率
  4. '''
  5. string = "010-87458345"
  6. com = re.compile('(\d{3})-(\d{8})') # 编译正则表达式
  7. print(com.findall(string)) # [('010', '87458345')]
  8. # 2.re.split() 按照指定的正则表达式拆分
  9. print(re.split('\d','hello12world35boy')) # ['hello', '', 'world', '', 'boy']
  10. # 3.匹配中文
  11. chinese = "[\u4e00-\u9fa5]+"
  12. print(re.search(chinese,'hello 你好 world 世界 girl 女孩')) # <re.Match object; span=(6, 8), match='你好'>
  13. # 4.re.sub 和 re.subn() 替换字符中正则匹配到内容为指定字符
  14. # re.subn() 会显示替换的总次数
  15. str1 = "下周 大家就开始 进入年假 模式,提前祝大家 新春快乐"
  16. print(re.sub("\s+",'.......',str1)) # 下周.......大家就开始.......进入年假.......模式,提前祝大家.......新春快乐
  17. print()
  18. print(re.subn("\s+",'.......',str1)) # ('下周.......大家就开始.......进入年假.......模式,提前祝大家.......新春快乐', 4)

二、办公自动化-操作excel

  1、python读取xls文件 

  1. import xlrd # 该模块用于读取xls文件
  2. # 获取xls文件中的工作对象
  3. wb = xlrd.open_workbook(r'E:\xzai\py\Python\02-Python高级编程\2-python办公自动化-操作excel\resources\阿里巴巴2020年股票数据.xls')
  4. # print(wb) wb的位置
  5. # 获取所有的工作表名称,获取对象个数
  6. sheet_names = wb.sheet_names()
  7. print(sheet_names)
  8. # 通过工作表名称获取具体的工作表对象,就是有几个表
  9. sheet = wb.sheet_by_name(sheet_names[0])
  10. # 查看指定工作表的行数和列数
  11. # print(sheet.nrows,sheet.ncols)
  12. # 通过循环的方式查看工作表中具体单元格的数据
  13. for row in range(sheet.nrows):# 行
  14. for col in range(sheet.ncols):# 列
  15. # print(row,col)
  16. # 通过cell对象中的value属性获取具体单元格的值
  17. value = sheet.cell(row,col).value
  18. # print(value)
  19. # 将第一行以外的数据进行格式化处理
  20. if row > 0:
  21. # 将第一列的日期数据转换为年月日的形式
  22. if col == 0:
  23. value = xlrd.xldate_as_tuple(value,0)
  24. # print(value) # (2019, 12, 31, 0, 0, 0)
  25. value = f"{value[0]}年{value[1]:>02d}月{value[2]:>02d}日"
  26. else:
  27. # 将其他列的数据处理成小数位数为2位的数据
  28. value = f"{value:.2f}"
  29. print(value,end="\t")
  30. print() # 输出格式
  31. # 获取单元格值的类型
  32. # 0-空值 1-字符串 2-数字 3-日期 4-布尔 5-错误
  33. last_cell_type = sheet.cell_type(sheet.nrows-1,sheet.ncols-1)
  34. #print(last_cell_type)
  35. # 获取第一行的数据
  36. #print(sheet.row_values(0))

 2、python向xls文件中写入内容

  1. import xlwt
  2. import random
  3. # 创建工作簿对象
  4. wb = xlwt.Workbook()
  5. # 创建工作表对象
  6. sheet = wb.add_sheet("python-2107班级")
  7. # 定义学生姓名
  8. students = ["刘备","关羽","张飞","黄忠","马超","赵云"]
  9. # 通过列表生成式的方式生成语文 数学 英语 三科的成绩 结果是二维列表
  10. scores = [[random.randrange(50,101) for i in range(3)] for j in range(6)]
  11. # print(scores)
  12. # 创建表头数据
  13. titles = ["姓名","语文","数学","英语"]
  14. for index,title in enumerate(titles):
  15. # print(index,title)
  16. # 第一个参数表示行 第二个参数表示列 第三个参数表示具体的内容
  17. sheet.write(0,index,title)
  18. # 将学生的姓名和成绩写入到工作表中去
  19. for row in range(len(scores)):
  20. # print(row)
  21. sheet.write(row+1,0,students[row]) # 从第二行开始写入学生相关的数据信息
  22. for col in range(len(scores[row])):
  23. sheet.write(row+1,col+1,scores[row][col]) # 从第二行第二列开始填充成绩数据
  24. # 将工作表数据保存到工作簿中去
  25. wb.save("考试成绩.xls")

  3、python向xls文件中写入内容添加样式

  1. import xlwt
  2. import random
  3. # 创建工作簿对象
  4. wb = xlwt.Workbook()
  5. # 创建工作表对象
  6. sheet = wb.add_sheet("python-2107班级")
  7. # 定义学生姓名
  8. students = ["刘备","关羽","张飞","黄忠","马超","赵云"]
  9. # 通过列表生成式的方式生成语文 数学 英语 三科的成绩 结果是二维列表
  10. scores = [[random.randrange(50,101) for i in range(3)] for j in range(6)]
  11. # print(scores)
  12. # 创建表头数据
  13. titles = ["姓名","语文","数学","英语"]
  14. # 给表头数据添加样式 颜色设置为红色
  15. header_style = xlwt.XFStyle()
  16. pattern = xlwt.Pattern()
  17. pattern.pattern = xlwt.Pattern.SOLID_PATTERN
  18. # 0-黑色 1-白色 2-红色 3-绿色 4-蓝色 5-黄色 6-粉色 7-青色
  19. pattern.pattern_fore_colour = 2
  20. header_style.pattern = pattern
  21. # 设置字体
  22. font = xlwt.Font()
  23. font.name = "华文楷体"
  24. # 字体大小(20是基准单位 18表示18px)
  25. font.height = 20 * 18
  26. # 是否使用粗体
  27. font.bold = True
  28. # 是否使用斜体
  29. font.italic = True
  30. # 字体颜色
  31. font.colour_index = 1
  32. # 添加样式
  33. header_style.font = font
  34. # 设置对齐方式
  35. align = xlwt.Alignment()
  36. # 垂直方向的对齐方式
  37. align.vert = xlwt.Alignment.VERT_CENTER
  38. # 水平方向的对齐方式
  39. align.horz = xlwt.Alignment.HORZ_CENTER
  40. header_style.alignment = align
  41. # 设置边框
  42. borders = xlwt.Borders()
  43. props = (
  44. ('top','top_colour'),('right','right_colour'),
  45. ('bottom','bottom_colour'),('left','left_colour')
  46. )
  47. # 通过循环设置边框四个方向的样式
  48. for position,color in props:
  49. # 使用setattr内置函数动态给对象指定的属性设置值
  50. setattr(borders,position,xlwt.Borders.DASHED)
  51. setattr(borders,color,5)
  52. header_style.borders = borders
  53. # 设置行高的值
  54. sheet.row(0).set_style(xlwt.easyxf(f'font:height {20 * 40}'))
  55. for index,title in enumerate(titles):
  56. # 设置列宽为200px
  57. sheet.col(index).width = 20 * 200
  58. # 第一个参数表示行 第二个参数表示列 第三个参数表示内容 第四个参数表示样式
  59. sheet.write(0,index,title,header_style)
  60. # 将学生的姓名和成绩写入到工作表中
  61. for row in range(len(scores)):
  62. sheet.write(row+1,0,students[row])
  63. for col in range(len(scores[row])):
  64. sheet.write(row+1,col+1,scores[row][col])
  65. # 将工作表数据保存到工作簿中去
  66. wb.save("添加了样式的考试成绩.xls")

4、python读取xlsx格式的文件

  1. import openpyxl
  2. # 加载一个工作薄
  3. wb = openpyxl.load_workbook(r"E:\xzai\千锋py\Python\02-Python高级编程\2-python办公自动化-操作excel\resources\阿里巴巴2020年股票数据.xlsx")
  4. # 获取工作表名称
  5. # print(wb.sheetnames)
  6. # 获取要操作的工作表
  7. sheet = wb.worksheets[0]
  8. #获取工作表中单元格的范围
  9. # print(sheet.dimensions) # A1:G255
  10. # 获取行数和列数
  11. # print(sheet.max_row,sheet.max_column) # 255 7
  12. # 获取指定单元格的值
  13. print(sheet.cell(3,3).value)
  14. # print(sheet['C3'].value)
  15. # print(sheet['G255'].value)
  16. # 获取多个单元格
  17. # print(sheet['A2:C5'])
  18. # 获取单元格中所有的数据
  19. for row in range(2,sheet.max_row+1):
  20. for col in "ABCDEFG":
  21. value = sheet[f'{col}{row}'].value
  22. print(value,end="\t")
  23. print()

5、python向xlsx格式的文件中写入内容

  1. import random
  2. import openpyxl
  3. # 第一步:创建工作薄
  4. wb = openpyxl.Workbook()
  5. # 第二步:添加工作表
  6. sheet = wb.active
  7. sheet.title = "测试成绩"
  8. # 第三步:写入数据 定义标题
  9. titles = ("姓名","骑马","射箭","摔跤")
  10. # 将标题数据写入到文件中
  11. for col_index,title in enumerate(titles):
  12. sheet.cell(1,col_index+1,title)
  13. # 定义学生姓名
  14. students = ("欣迪","中文","文定","珊珊","惠君","俊德")
  15. # 将姓名和成绩写入到文件中去
  16. for row_index,student in enumerate(students):
  17. sheet.cell(row_index+2,1,student)
  18. for col_index in range(2,5):
  19. sheet.cell(row_index+2,col_index,random.randrange(50,101))
  20. # 将数据保存到工作簿中去
  21. wb.save("期末测试成绩.xlsx")
  22. # 注意:在 2007年之后的xlsx文件中的行和列的索引是从1开始
  23. # 在2007年之前的xls文件中的行和列的索引是从0开始

6、python向xlsx格式的文件中添加样式

  1. import openpyxl
  2. from openpyxl.styles import Font,Alignment,Border,Side
  3. # 设置对齐方式
  4. alignment = Alignment(vertical="center",horizontal="center")
  5. # 设置边框的线条
  6. side = Side(color="ff7f50",style="mediumDashed")
  7. # 加载工作薄
  8. wb = openpyxl.load_workbook(r"C:\python07\day17\期末测试成绩.xlsx")
  9. # 获取指定的工作表
  10. sheet = wb.worksheets[0]
  11. # 调整行高和列宽
  12. sheet.row_dimensions[1].height = 30
  13. sheet.column_dimensions["E"].width = 120
  14. sheet['E1'] = "平均分"
  15. # 设置字体
  16. sheet.cell(1,5).font = Font(size=18,bold=True,color='ff1493',name="华文楷体")
  17. # 设置对齐方式
  18. sheet.cell(1,5).alignment = alignment
  19. # 设置单元格边框
  20. sheet.cell(1,5).border = Border(left=side,right=side,top=side,bottom=side)
  21. for i in range(2,8):
  22. # 利用公式计算每个学生的平均分
  23. sheet[f"E{i}"] = f"=average(B{i}:D{i})"
  24. sheet.cell(i,5).font = Font(size=12,color='4169e1',italic=True)
  25. sheet.cell(i,5).alignment = alignment
  26. wb.save("添加样式-期末测试成绩.xlsx")

7、python使用openpyxl生成统计图表

  1. from openpyxl import Workbook
  2. from openpyxl.chart import BarChart, Reference
  3. wb = Workbook(write_only=True) # 创建工作簿
  4. sheet = wb.create_sheet("手机销量统计") # 创建表
  5. rows = [
  6. ('类别', 'G战区', "X战区"),
  7. ('小米', 88, 76),
  8. ('vivo', 68, 89),
  9. ('oppo', 87, 59)
  10. ]
  11. # 向工作表中添加行
  12. for row in rows:
  13. sheet.append(row)
  14. # 创建图表对象
  15. chart = BarChart()
  16. # 图表类型,大小
  17. chart.type = "col"
  18. chart.style = 10
  19. # 设置图表的标题
  20. chart.title = "手机销量统计"
  21. # 设置纵轴标题
  22. chart.y_axis.title = "销量"
  23. # 设置横轴标题
  24. chart.x_axis.title = "手机品牌"
  25. # 柱状图的数据区域 data 表示柱状图的数据区域,使用Reference函数指定了在工作表 e 中的数据范围。
  26. # 其中,min_col=2 表示数据区域的起始列为第 2 列(G战区数据),min_row=1 表示数据区域的起始行为第 1 行,
  27. # max_row=4 表示数据区域的结束行为第 4 行(包括标题行)
  28. # ,max_col=3 表示数据区域的结束列为第 3 列(X战区数据)。这样,您将选择了工作表中包含数据的矩形区域。
  29. data = Reference(sheet, min_col=2, min_row=1, max_row=5, max_col=3)
  30. # 设置分类的范围
  31. # categories 表示柱状图的分类区域,使用Reference函数指定了在工作表 e 中的分类范围。
  32. # 其中,min_col=1 表示分类区域的起始列为第 1 列(类别),min_row=2 表示分类区域的起始行为第 2 行,
  33. # max_row=4 表示分类区域的结束行为第 4 行。这样,您选择了工作表中的分类名称的范围。
  34. # 接下来,使用 chart.add_data(data, titles_from_data=True) 将数据区域添加到柱状图中,
  35. # 并使用 titles_from_data=True 参数将数据区域的第一行作为图表的标题。
  36. # 最后,使用 chart.set_categories(categories) 将分类区域应用于柱状图的分类轴。
  37. cats = Reference(sheet, min_col=1, min_row=2, max_row=5)
  38. # 给图表添加数据
  39. chart.add_data(data, titles_from_data=True)
  40. # 给图表设置分类
  41. chart.set_categories(cats)
  42. chart.shape = 4
  43. # 将图表插入到指定的单元格中
  44. sheet.add_chart(chart, "A10")
  45. wb.save("手机销量统计.xlsx")

三、word

1、python操作word文件

  1. from pydoc import doc
  2. from docx import Document
  3. # docx.shared 用于设置字体大小(图片)等信息
  4. from docx.shared import Cm,Pt
  5. # 创建word文档对象
  6. document = Document()
  7. print(document)
  8. # 添加大标题
  9. document.add_heading("快快乐乐每一天",0)
  10. # 添加段落
  11. p = document.add_paragraph("添加段落的方法")
  12. # 在段落的基础上添加内容 add_run()
  13. run = p.add_run("最新新闻广西百色疫情特别严重,如果是百色的人,注意防护")
  14. run.bold = True # 是否加粗 True表示加粗 False表示不加粗
  15. run.font.size = Pt(18) # 字体大小设置为18
  16. run.underline = True # True表示添加下划线 False表示不添加下划线
  17. # 添加一级标题
  18. document.add_heading("一级标题",level=1)
  19. # 添加二级标题
  20. document.add_heading("二级标题",level=2)
  21. # 添加三级标题
  22. document.add_heading("三级标题",level=3)
  23. # 添加带样式的段落
  24. p = document.add_paragraph("带样式的段落",style = "Intense Quote")
  25. # 添加无序列表 style = "List Bullet" 表示无序列表
  26. document.add_paragraph("无序列表第一条数据",style="List Bullet")
  27. document.add_paragraph("无序列表第二条数据",style="List Bullet")
  28. document.add_paragraph("无序列表第三条数据",style="List Bullet")
  29. # 添加有序列表 style = "List Number" 表示有序列表
  30. document.add_paragraph("有序列表第一条数据",style="List Number")
  31. document.add_paragraph("有序列表第二条数据",style="List Number")
  32. document.add_paragraph("有序列表第三条数据",style="List Number")
  33. # 向word文件中添加图片 (注意:图片的路径必须真实存在)
  34. document.add_picture(r"C:\python基础\26-python办公自动化-操作word\resources\meinv.jpg",width=Cm(5.2))
  35. # 向word文件中添加表格
  36. records = (
  37. ("欣迪","美女","2000-02-11"),
  38. ("周超","靓仔","2000-03-01"),
  39. ("文定","猛男","2001-11-14"),
  40. ("世林","男","1999-04-21"),
  41. ("俊德","男","1998-03-16")
  42. )
  43. table = document.add_table(rows=1,cols=3) # rows=1表示从第一行开始
  44. table.style = "Table Grid" # 表示表格的样式
  45. head_cells = table.rows[0].cells #添加表格的标题
  46. head_cells[0].text = "姓名"
  47. head_cells[1].text = "性别"
  48. head_cells[2].text = "出生日期"
  49. # 向表格中添加数据
  50. for name,sex,birthday in records:
  51. row_cells = table.add_row().cells # 向表格中的每一行添加数据
  52. row_cells[0].text = name
  53. row_cells[1].text = sex
  54. row_cells[2].text = birthday
  55. # 保存文件
  56. document.save("创建word文件.docx")

2、使用python读取word文件

  1. from docx import Document
  2. doc = Document(r"C:\python基础\26-python办公自动化-操作word\resources\离职证明模板.docx")
  3. for no,p in enumerate(doc.paragraphs): # no表示行号 p表示段落 doc.paragraphs表示文档的所有的段落
  4. print(no,p.text) # p.text表示段落的内容

3、python实现批量生成word文件

  1. from docx import Document
  2. # 将员工真实的信息以字典的形式进行保存
  3. person_list = [
  4. {
  5. "name":"欣迪",
  6. "id":"333222444555666999",
  7. "sdate":"2018年3月1日",
  8. "edate":"2022年2月10日",
  9. "department":"技术部",
  10. "position":"数据分析专家",
  11. "company":"深圳腾讯科技有限公司"
  12. },
  13. {
  14. "name":"文定",
  15. "id":"323242464785676954",
  16. "sdate":"2019年4月11日",
  17. "edate":"2022年2月15日",
  18. "department":"行政部",
  19. "position":"打手",
  20. "company":"赣州天上人间会所"
  21. },
  22. {
  23. "name":"周超",
  24. "id":"643242466485673954",
  25. "sdate":"2017年5月21日",
  26. "edate":"2022年2月14日",
  27. "department":"后厨部",
  28. "position":"配菜员",
  29. "company":"深圳金威源餐饮有限公司"
  30. },
  31. {
  32. "name":"李军",
  33. "id":"443245466455673954",
  34. "sdate":"2019年8月21日",
  35. "edate":"2022年2月13日",
  36. "department":"后勤部",
  37. "position":"大茶壶",
  38. "company":"重庆怡红院高级会所"
  39. }
  40. ]
  41. # 对列表进行循环遍历,批量生成word文件
  42. for person in person_list:
  43. # print(person)
  44. # 读取离职证明模板文件
  45. doc = Document(r"C:\python基础\26-python办公自动化-操作word\resources\离职证明模板.docx")
  46. # 循环遍历模板文件中所有的段落,查找占位符
  47. for p in doc.paragraphs:
  48. # print(p.text)
  49. if "{" not in p.text:
  50. continue
  51. # 不能直接修改段落内容,否则会丢失样式,所以需要对段落中的元素进行遍历并进行查找和替换
  52. for run in p.runs:
  53. # print(run.text)
  54. if '{' not in run.text:
  55. continue
  56. # 找到占位符的开始位置{ 和结束位置 } 进行内容替换
  57. start,end = run.text.find("{"),run.text.find("}")
  58. # print(start,end)
  59. key,place_holder = run.text[start+1:end],run.text[start:end+1]
  60. # print(key,place_holder) # key === >name place_holder ==== > {name}
  61. run.text = run.text.replace(place_holder,person[key])
  62. # print(run.text)
  63. # 每个人的信息保存一个word文档
  64. doc.save(f"{person['name']}的离职证明.docx")

4、import xlrd ,xlwt,random

  1. import xlrd ,xlwt,random
  2. workbook=xlwt.Workbook # 创建Excel表工作薄
  3. xls=workbook.add_sheet("python-2107班级") # 创建Excel表对象
  4. xls.write('shuji','nan',14)
  5. workbook.save("H.xls")

四、PDF

1python读取pdf文件

  1. # 安装 PyPDF2 三方库用于读取pdf文件中的文本
  2. # pip install PyPDF2
  3. import PyPDF2
  4. # 读取pdf文件
  5. reader = PyPDF2.PdfFileReader(r"C:\python基础\28-python办公自动化-操作pdf\test.pdf")
  6. # print(reader)
  7. # 获取指定的页码文本
  8. page = reader.getPage(0)
  9. # 输出当前页码的文本
  10. print(page.extractText())

2通过python旋转pdf文件和创建空白pdf文件

  1. import PyPDF2
  2. # 创建读取pdf文件的对象
  3. reader = PyPDF2.PdfFileReader(r"C:\python基础\28-python办公自动化-操作pdf\XGBoost.pdf")
  4. # 创建写pdf文件的writer对象
  5. writer = PyPDF2.PdfFileWriter()
  6. # 获取pdf文件的所有页码
  7. # print(reader.numPages) # 13
  8. # 对pdf文件中的所有的页码进行循环遍历
  9. for page_num in range(reader.numPages):
  10. # 获取当前页码的对象
  11. current_page = reader.getPage(page_num)
  12. # 奇数页顺时针旋转90度
  13. if page_num % 2 != 0:
  14. current_page.rotateClockwise(90)
  15. # 偶数页逆时针旋转90度
  16. else:
  17. current_page.rotateCounterClockwise(90)
  18. writer.addPage(current_page)
  19. # 添加空白页面,并且旋转90度
  20. page = writer.addBlankPage()
  21. page.rotateClockwise(90)
  22. # 通过writer对象的write方法将将旋转后的pdf写入到新文件中
  23. with open(r"C:\python07\day19\代码\XGBoost-旋转.pdf","wb") as file:
  24. writer.write(file)

3通过python对pdf文件进行加密

  1. import PyPDF2
  2. # 创建读取pdf文件的对象
  3. reader = PyPDF2.PdfFileReader(r"C:\python基础\28-python办公自动化-操作pdf\XGBoost.pdf")
  4. # 创建写入pdf文件的对象
  5. writer = PyPDF2.PdfFileWriter()
  6. for page_num in range(reader.numPages):
  7. # 将原文件的每一页追加到writer对象中去
  8. writer.addPage(reader.getPage(page_num))
  9. # 给writer对象设置密码
  10. writer.encrypt("123456")
  11. # 创建文件,将加密后的内容写入到新文件中去
  12. with open("C:\python07\day19\代码\XGBoost-加密.pdf","wb") as file:
  13. writer.write(file)

4通过python对pdf文件添加水印

  1. import PyPDF2
  2. # 读取原pdf文件
  3. reader1 = PyPDF2.PdfFileReader(r"C:\python基础\28-python办公自动化-操作pdf\XGBoost.pdf")
  4. # 读取水印文件
  5. reader2 = PyPDF2.PdfFileReader(r"C:\python基础\28-python办公自动化-操作pdf\watermark.pdf")
  6. # 创建写入pdf文件的对象
  7. writer = PyPDF2.PdfFileWriter()
  8. # 获取水印页
  9. watermark_page = reader2.getPage(0)
  10. for page_num in range(reader1.numPages):
  11. # 获取当前页对象
  12. current_page = reader1.getPage(page_num)
  13. # 将原文件的每一页和水印页合并
  14. current_page.mergePage(watermark_page)
  15. writer.addPage(current_page)
  16. # 将添加完水印页的文件写入到新文件中去
  17. with open("C:\python基础\28-python办公自动化-操作pdf\XGBoost-添加水印.pdf","wb") as file:
  18. writer.write(file)

五、PPT

1.python中的pillow模块

  1. # 安装pillow 模块 pip install pillow
  2. from PIL import Image
  3. # 打开图片 open()
  4. # 显示图片 show()
  5. img_path = r"C:\python基础\27-python办公自动化-操作ppt\resources\11.jpg"
  6. # 打开图片
  7. img = Image.open(img_path)
  8. # 显示图片
  9. # img.show()
  10. # 旋转和翻转图片
  11. '''
  12. rotate() 返回旋转后的新图像,原图片不变,逆时针旋转
  13. save() 保存图片
  14. '''
  15. # img.rotate(45).save("./hehe.jpg")
  16. # 调整图片的大小 resize((width+-数字,height+-数字)) 参数:(width+-数字,height+-数字)
  17. # size 表示的是大小
  18. width,height = img.size
  19. print(width,height)
  20. resizeImg = img.resize((width+300,height+150))
  21. resizeImg.save("./调整后的图片.jpg")

2.python操作ppt

  1. from pptx import Presentation
  2. # 创建幻灯片对象
  3. pres = Presentation()
  4. # 选择母版添加一页
  5. tilte_slide_layout = pres.slide_layouts[0]
  6. slide = pres.slides.add_slide(tilte_slide_layout)
  7. # 获取标题栏和副标题栏
  8. title = slide.shapes.title
  9. subtitle = slide.placeholders[1]
  10. # 编辑主标题和副标题
  11. title.text = "welcome to python"
  12. subtitle.text = "Life is short, I use python"
  13. # 选择母版添加一页
  14. bullet_slide_layout = pres.slide_layouts[1]
  15. slide = pres.slides.add_slide(bullet_slide_layout)
  16. # 获取页面上面所有的形状
  17. shapes = slide.shapes
  18. # print(shapes)
  19. # 获取标题和主体
  20. title_shape = shapes.title
  21. body_shape = shapes.placeholders[1]
  22. # 编辑标题
  23. title_shape.text = "介绍"
  24. # 编辑主体内容
  25. tf = body_shape.text_frame
  26. tf.text = "History of Python"
  27. # 添加一个一级段落
  28. p = tf.add_paragraph()
  29. p.text = "hello world"
  30. p.level = 1
  31. # 添加一个二级段落
  32. p = tf.add_paragraph()
  33. p.text = "马上开始"
  34. p.level = 2
  35. # 保存幻灯片
  36. pres.save("测试.pptx")

3.图表

  1. from pptx import Presentation
  2. from pptx.chart.data import CategoryChartData
  3. from pptx.enum.chart import XL_CHART_TYPE
  4. from pptx.util import Inches
  5. # create presentation with 1 slide ------
  6. prs = Presentation()
  7. slide = prs.slides.add_slide(prs.slide_layouts[5])
  8. # define chart data ---------------------
  9. chart_data = CategoryChartData()
  10. chart_data.categories = ['East', 'West', 'Midwest']
  11. chart_data.add_series('Series 1', (19.2, 21.4, 16.7))
  12. # add chart to slide --------------------
  13. x, y, cx, cy = Inches(2), Inches(2), Inches(6), Inches(4.5)
  14. slide.shapes.add_chart(
  15. XL_CHART_TYPE.COLUMN_CLUSTERED, x, y, cx, cy, chart_data
  16. )
  17. prs.save('chart-01.pptx')

4.饼图

  1. from pptx import Presentation
  2. from pptx.chart.data import ChartData
  3. from pptx.enum.chart import XL_CHART_TYPE
  4. from pptx.util import Inches
  5. chart_data = ChartData()
  6. chart_data.categories = ['West', 'East', 'North', 'South', 'Other']
  7. chart_data.add_series('Series 1', (0.135, 0.324, 0.180, 0.235, 0.126))
  8. chart = slide.shapes.add_chart(
  9. XL_CHART_TYPE.PIE, x, y, cx, cy, chart_data
  10. ).chart
  11. chart.has_legend = True
  12. chart.legend.position = XL_LEGEND_POSITION.BOTTOM
  13. chart.legend.include_in_layout = False
  14. chart.plots[0].has_data_labels = True
  15. data_labels = chart.plots[0].data_labels
  16. data_labels.number_format = '0%'
  17. data_labels.position = XL_LABEL_POSITION.OUTSIDE_END

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/213327
推荐阅读
相关标签
  

闽ICP备14008679号