当前位置:   article > 正文

markdown 工具_自己写的几个学习Python的工具(1)-截取网页为Markdown文档

markdown怎么截取代码

0fbe4f825384bba3ebec9db24a8e2047.png

平时为了学习Python,经常要到网上去查一些资料,很多时候就特别希望把一些内容保留下来,所以就希望能把网页里的一些内容保存为Markdown·格式,便于存在自己的文件里,或者发布到其他论坛里去。

在网上找了一些程序感觉都不适合自己,于是决定自己写一段。

其实这个程序,也是我后面几个应用的基础,所以下了一些功夫,把它打造成一个通用的库。

你只需要运行一下这个程序

python html2md.py

他就会监控你的剪贴板。

等你打开你学习的网页,选择一下你想保存下来的哪些部分

8a3b93e5fdbc765e5ab869dcbdba50d3.png

然后按一下Ctrl+C,进行复制

随后进到你的编辑器,按一下Ctrl+V,进行粘贴

35092ac50a6b566e0f0da3195a805376.png

看到木有,原来的网页变成Markdown文本了,右边是markdown的预览

是不是比原来网页似乎还漂亮一些。

很爽、很轻松吧。

程序缺省的输出,是依照Github的GFM标准来的,你要是希望把结果直接贴到其他论坛去,你可以按照那些论坛的标准,对程序的一些功能进行开关,可选参数有

-h, --help 显示帮助信息
-e, --ignore-emphasis
不包含黑体、斜体这些加重的Tag,缺省是包含
-i, --ignore-images 不包含图像,遇到图像会忽略掉,缺省是包含
-l, --ignore-links 不包含链接,遇到链接会忽略掉,缺省是包含
-d, --def_list 不转换DL、DD这类列表,保留HTML格式,缺省是转换
-t, --table 不转换表格,保留HTML格式,缺省是转换
-s, --strikethrough 不转换删除线,保留HTML格式,缺省是转换
-a, --attrs 保留链接的属性,缺省是不保留
-D, --dash-unordered-list
使用'-'而不是'*'来作为列表的标志, 缺省用'*'
-E, --asterisk-emphasis
使用''而不是'_'来作为斜体的标志,使用'__'而不是'*'来作为斜体的标志, 缺省用‘_‘和'**'
-o OUTPUT_FILE , --output_file OUTPUT_FILE
输出文件名,缺省输出是剪贴板

比如,你要贴到一个论坛里去,那个论坛不支持markdown的表格,你就可以在命令行,加上参数 -t ,你最终文档里的表格会保留HTML格式。

当然你也可以写自己的程序调用这段程序,他本来就是作为一个包来用的

  1. from html2hd import html2hd
  2. markdown = html2md("<p>Hello, world.</p>")

详细内容去访问我的Github吧,包括下载程序

https://github.com/steve-hao/html2md​github.com

有啥想法和建议,随时和我交流啊。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/74352
推荐阅读
相关标签
  

闽ICP备14008679号