赞
踩
用途:爬⾍就是通过编写程序来爬取互联⽹上的优秀资源(图⽚, ⾳频, 视频, 数据)
使用Python的优点:
⽽Python是众多编程语⾔中, ⼩⽩上⼿最快, 语法最简单. 有⾮常多的关于爬⾍能⽤到的第三⽅⽀持库.
法律允许爬虫的存在,但是!存在违法风险。
善意的爬⾍: 不破坏被爬取的⽹站的资源(正常访问, ⼀般频率不
⾼, 不窃取⽤户隐私)
恶意的爬⾍: 影响⽹站的正常运营(抢票, 秒杀, 疯狂solo⽹站资源造成⽹站宕机)
⻔户⽹站可以通过制定相应的策略或者技术⼿段,防⽌爬⾍程序进⾏⽹站数据的爬取。
爬⾍程序可以通过制定相关的策略或者技术⼿段,破解⻔户⽹站中具备的反爬机制,从⽽可以获取⻔户⽹站中相关的数据。
君⼦协议。规定了⽹站中哪些数据可以被爬⾍爬取哪些数据不可以被爬取,只是一个协议
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。