赞
踩
现在磁力站很多,但是搜出来的东西乱七八糟的,广告也多,我看多了觉得挺烦的,正好周末无聊,想着自己做一个,下面附上本次利用Python爬虫磁力站点的教程。
下面是我写爬虫时候主要引用的库
当然,抓取的关键词可以自己从代码里设置,比如title,文件大小之类的。
但我怎么知道爬出来的哪些数据是没有用的呢?自己手动一个一个试显然不靠谱。
其实我并不需要知道哪些数据是没有用的,我只需要确定哪些数据是有用的就可以!!!
我的做法是:尝试和traceker通信,通信成功的链接才会保留下来帮我导出到excel,通信失败的,就直接剔除。
对了,这里跟大家解释一下Tracker是什么?
tracker服务器是BT下载中必须的角色。一个
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。