赞
踩
本代码用来将learnCpp 转换为PDF书籍,便于离线阅读。
首先,使用pyautogui打开浏览器,然后打印所有的页面。
这里有两个前提条件:
#wpdcom{ display:none; } /* .prevnext-inline{ display:none; } */ /* #masthead{ display:none; } .wpsolution{ display:block !important; } .solution_link_show{ display:none; } */
收集网址和章节名
使用浏览器来打印这些课程并组织打印的文件。
检查是否有遗漏和错误的文件。
使用fitz来组合成单个PDF文件。
在Github 直接下载或者克隆本项目 git clone https://github.com/YellowAndGreen/LearnCpp-PDFconverter.git
使用webpage2pdf.py来下载课程。
或许有一些参数需要根据实际情况调整(比如time.sleep(2))。
为什么不适用浏览器驱动(基于Selenium)来自动化这个过程?
使用浏览器驱动很难修改格式,而且浏览器驱动打开的页面不包含任何驱动,也就是说很难去控制CSS。
https://github.com/YellowAndGreen/LearnCpp-PDFconverter
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。