赞
踩
上期提到了如何获取公众号文章信息,这回就说下怎么将网页转为PDF,方便日常学习。html
而后扩散一下以前一个比赛的结果(华章计算机抖音大赛)。数据库
顺便谈谈本身对从此送书的一个想法。微信
另外以前的送书活动,有中奖的读者没有联系我,因此这回一并送出。app
明天还会送两本书,你们也能够关注一下。ide
/ 01 / HTML转PDF学习
主要用到的库有pdfkit及wkhtmltopdf。url
安装我就不说了,网上也是一堆教程,经过下面的代码也能略知一二。spa
须要注意的点就是,把网页转PDF的时候,须要将网页的图片下载下来,保存在本地。orm
而后生成网页时调用本地的图片,这样就不会出如今PDF中图片缺失的状况。htm
本次没有去设置详细的PDF参数,因此生成的PDF排版并非很友好,不过仍是能凑合看的。
具体转换代码以下。
import pandas as pd
import requests
import pdfkit
import os
import re
# 读取数据并清洗
df = pd.read_csv('article.csv', header=None, names=['title', 'digest', 'article_url', 'date'], encoding='gbk')
df['date'] = pd.to_datetime(df.date.values, unit='s'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。