赞
踩
最近在做需求的时候,需要将excel的xlsx文件转为html。
试着找了网上的好多方法,大部分都是table转excel,很少excel转为table标签。
如果用pandas库的to_html方法,并不能对合并单元格做有效的处理
目前会读取单元格行高,列宽,字体大小,是否加粗,合并单元格等
如果需要不是你们的需要生成的格式,大家可以在里面加样式就可以
1.读取excel 并 定义相关变量
- import re
- from openpyxl import load_workbook
- from openpyxl.cell import MergedCell
-
- file=r'你的excel文件路径'
- wb=load_workbook(filename=file)
- sheet=wb[wb.sheetnames['用于转换的sheet索引页']]
- cell_dic= {} #用于储存 所有合并单元格的左上单元格对象
- col_width={} #用于储存 所有列的列宽,px
- row_height={} #用于储存 所有列的行高,px
2.查询所有列的列宽
- #查询列宽
- for col in sheet.columns:
- pat=r"[A-Z]+"
- pat=re.compile(pat)
- colname=pat.findall(col[0].coordinate)[0] #分离字母 和数字,取出列字母名称
- px=round(sheet.column_dimensions[colname].width*5) #读出列宽换算为像素
- col_width[colname]=px
3.查询所有行的行高
- #查询行高
- for row in sheet.rows:
- pat=r"[A-Z]+(\d+)"
- pat=re.compile(pat)
- rowid=int(pat.findall(row[0].coordinate)[0]) #分离字母 和数字,取出行数字序号
- px=sheet.row_dimensions[rowid].height #读出行高换算为像素
- if px == None:
- px=13.5
- row_height[str(rowid)]=px
4.遍历合并的单元区域,找到左上位置的单元格储存在cell_dic字典中,注释很详细
-
- # 找出所有合并区域的行高,列宽,向右合并距离,向下合并距离
- for merged_range in sheet.merged_cells.ranges:
- now_width=0 #定义列宽
- now_height=0 #定义行高
- for i in range(merged_range.min_col,merged_range.max_col+1):
- coord = sheet.cell(row=1, column=i).coordinate #位置标识,例如:A1
- pat = r"[A-Z]+"
- pat = re.compile(pat)
- colname = pat.findall(coord)[0] # 分离字母 和数字,取出列字母名称
- now_width=now_width+col_width[colname]
- for i in range(merged_range.min_row, merged_range.max_row + 1):
- coord = sheet.cell(row=i, column=1).coordinate # 位置标识,例如:A1
- pat = r"[A-Z]+(\d+)"
- pat = re.compile(pat)
- colindex = pat.findall(coord)[0] # 分离字母 和数字,取出列数字名称
- now_height=now_height+row_height[colindex]
-
- now_width=int(now_width) #合并单元格列宽(所有子单元格相加)
- now_height=int(now_height) #合并单元格行高(所有子单元格相加)
-
- cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col) # 选择合并区域左上单元格
- colspan = merged_range.max_col - merged_range.min_col + 1 #向右合并长度
- rowspan = merged_range.max_row - merged_range.min_row + 1 #向下合并长度
- cell_dic[cell]=(now_height,now_width,colspan,rowspan)
5. 这里先定义一个table标签头,不懂的可以去学下html 的table标签
html='''<table border="1">'''
6.这块主要就是拼接html了
- #开始写入数据到table标签
- for row in sheet.rows:
- tr='''<tr>'''
- for cell in row:
- td=""
- if cell in cell_dic: #判断是否为合并单元格左上单元格
- if cell.value == None:
- text=''
- else:
- text=cell.value
-
- if cell.alignment.vertical != None:
- vertical =f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
- else:
- vertical = ''
- if cell.alignment.horizontal != None:
- horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
- else:
- horizontal = ''
-
- font_size=str(int(cell.font.size)+3) #字体大小
- font_weight='700' if cell.font.b else '400' #字体是否加粗
- style=f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
- td = f'''<td height="{cell_dic[cell][0]}" width="{cell_dic[cell][1]}" colspan="{cell_dic[cell][2]}" rowspan="{cell_dic[cell][3]}" style={style}>{text}</td>'''
- else:
- if not isinstance(cell, MergedCell): # 判断该单元格是否为合并单元格
- if cell.alignment.vertical != None:
- vertical = f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
- else:
- vertical = ''
- if cell.alignment.horizontal != None:
- horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
- else:
- horizontal = ''
- pat = r"([A-Z]+)(\d+)"
- pat = re.compile(pat)
- cell_name=pat.findall(cell.coordinate)[0][0]
- cell_index = pat.findall(cell.coordinate)[0][1]
- font_size=str(int(cell.font.size)+3) #字体大小
- font_weight = '700' if cell.font.b else '400' # 字体是否加粗
- style = f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
- if cell.value != None:
- td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}" style={style} >{cell.value}</td>'''
- else:
- td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}"></td>'''
- tr=tr+td
-
- tr=tr+'''</tr>'''
- html=html+tr
7.再加一个table标签尾巴,写入本地 end
- html=html+'''</table>'''
- #写入本地
- with open(r"写入路径",'w',encoding='utf-8') as f:
- f.write(html)
- import re
- from openpyxl import load_workbook
- from openpyxl.cell import MergedCell
-
-
- class to_html():
- def __init__(self,file,save_file,sheet_name):
- self.file=file #文件路径
- self.save_file=save_file #html保存路径
- self.sheet_name=sheet_name #sheet名
- def creat_html(self):
- wb=load_workbook(filename=self.file)
- sheet=wb[self.sheet_name]
- cell_dic= {} #用于储存 所有合并单元格的左上单元格对象
- col_width={} #用于储存 所有列的列宽,px
- row_height={} #用于储存 所有列的行高,px
- #查询列宽
- for col in sheet.columns:
- pat=r"[A-Z]+"
- pat=re.compile(pat)
- colname=pat.findall(col[0].coordinate)[0] #分离字母 和数字,取出列字母名称
- px=round(sheet.column_dimensions[colname].width*5) #读出列宽换算为像素
- col_width[colname]=px
- #查询行高
- for row in sheet.rows:
- pat=r"[A-Z]+(\d+)"
- pat=re.compile(pat)
- rowid=int(pat.findall(row[0].coordinate)[0]) #分离字母 和数字,取出行数字序号
- px=sheet.row_dimensions[rowid].height #读出行高换算为像素
- if px == None:
- px=13.5
- row_height[str(rowid)]=px
-
- # 找出所有合并区域的行高,列宽,向右合并距离,向下合并距离
- for merged_range in sheet.merged_cells.ranges:
- now_width=0 #定义列宽
- now_height=0 #定义行高
- for i in range(merged_range.min_col,merged_range.max_col+1):
- coord = sheet.cell(row=1, column=i).coordinate #位置标识,例如:A1
- pat = r"[A-Z]+"
- pat = re.compile(pat)
- colname = pat.findall(coord)[0] # 分离字母 和数字,取出列字母名称
- now_width=now_width+col_width[colname]
- for i in range(merged_range.min_row, merged_range.max_row + 1):
- coord = sheet.cell(row=i, column=1).coordinate # 位置标识,例如:A1
- pat = r"[A-Z]+(\d+)"
- pat = re.compile(pat)
- colindex = pat.findall(coord)[0] # 分离字母 和数字,取出列数字名称
- now_height=now_height+row_height[colindex]
-
- now_width=int(now_width) #合并单元格列宽(所有子单元格相加)
- now_height=int(now_height) #合并单元格行高(所有子单元格相加)
-
- cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col) # 选择合并区域左上单元格
- colspan = merged_range.max_col - merged_range.min_col + 1 #向右合并长度
- rowspan = merged_range.max_row - merged_range.min_row + 1 #向下合并长度
- cell_dic[cell]=(now_height,now_width,colspan,rowspan)
-
- html='''<table border="1">'''
- #开始写入数据到table标签
- for row in sheet.rows:
- tr='''<tr>'''
- for cell in row:
- td=""
- if cell in cell_dic: #判断是否为合并单元格左上单元格
- if cell.value == None:
- text=''
- else:
- text=cell.value
-
- if cell.alignment.vertical != None:
- vertical =f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
- else:
- vertical = ''
- if cell.alignment.horizontal != None:
- horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
- else:
- horizontal = ''
-
- font_size=str(int(cell.font.size)+3) #字体大小
- font_weight='700' if cell.font.b else '400' #字体是否加粗
- style=f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
- td = f'''<td height="{cell_dic[cell][0]}" width="{cell_dic[cell][1]}" colspan="{cell_dic[cell][2]}" rowspan="{cell_dic[cell][3]}" style={style}>{text}</td>'''
- else:
- if not isinstance(cell, MergedCell): # 判断该单元格是否为合并单元格
- if cell.alignment.vertical != None:
- vertical = f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
- else:
- vertical = ''
- if cell.alignment.horizontal != None:
- horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
- else:
- horizontal = ''
- pat = r"([A-Z]+)(\d+)"
- pat = re.compile(pat)
- cell_name=pat.findall(cell.coordinate)[0][0]
- cell_index = pat.findall(cell.coordinate)[0][1]
- font_size=str(int(cell.font.size)+3) #字体大小
- font_weight = '700' if cell.font.b else '400' # 字体是否加粗
- style = f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
- if cell.value != None:
- td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}" style={style} >{cell.value}</td>'''
- else:
- td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}"></td>'''
- tr=tr+td
-
- tr=tr+'''</tr>'''
- html=html+tr
-
- html=html+'''</table>'''
- with open(self.save_file,'w',encoding='utf-8') as f:
- f.write(html)
-
- if __name__=='__main__':
- data=to_html("D:\\test.xlsx","D:\\test.html","测试sheet")
- data.creat_html()
测试图
生成的html源代码
<table border="1"> <tr> <td height="13" width="195" colspan="3" rowspan="1" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">合并单元格</td> </tr> <tr> <td height="18.75" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 700; font-style: normal;vertical-align: center;">加粗</td> <td height="18.75" width="65" style="color: rgb(0, 0, 0); font-size: 17px; font-weight: 400; font-style: normal;vertical-align: center;">宋体</td> <td height="18.75" width="65"> </td> </tr> <tr> <td height="27" width="130" colspan="2" rowspan="2" style="color: rgb(0, 0, 0); font-size: 21px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">合并单元格</td> <td height="13.5" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">居中</td> </tr> <tr> <td height="13.5" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: right;">靠右</td> </tr> </table>
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。