当前位置:   article > 正文

爬虫实例:链家网房源数据爬取_链家爬虫

链家爬虫

 

初接触python爬虫,跟着视频学习一些很基础的内容,小小尝试了一下,如有错误感谢指正。

库和方法介绍:

(1)requests

requests是python的工具包,用于发出请求,,是用来获取网站数据。Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。本次爬取代码使用的其中的get方法,最通常的方法是通过r=request.get(url)构造一个向服务器请求资源的url对象。这个对象是Request库内部生成的。这时候返回的是一个包含服务器资源的Response对象。

(2)pandas 

pandas是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/196513
推荐阅读
相关标签
  

闽ICP备14008679号