赞
踩
初接触python爬虫,跟着视频学习一些很基础的内容,小小尝试了一下,如有错误感谢指正。
库和方法介绍:
(1)requests
requests是python的工具包,用于发出请求,,是用来获取网站数据。Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。本次爬取代码使用的其中的get方法,最通常的方法是通过r=request.get(url)构造一个向服务器请求资源的url对象。这个对象是Request库内部生成的。这时候返回的是一个包含服务器资源的Response对象。
(2)pandas
pandas是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。