赞
踩
带伙伴们学习python爬虫,准备了几个简单的入门实例,分享给大家。
涉及主要知识点:
1、web是如何交互的
2、requests库的get、post函数的应用
3、response对象的相关函数,属性
4、python文件的打开,保存
代码中给出了注释,并且可以直接运行哦
如何安装requests库(安装好python的朋友可以直接参考,没有的,建议先装一哈python环境)
windows用户,Linux用户几乎一样:打开cmd输入以下命令即可,如果python的环境在C盘的目录,会提示权限不够,只需以管理员方式运行cmd窗口
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
Linux用户类似(ubantu为例): 权限不够的话在命令前加入sudo即可
sudo pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
# 第一个爬虫示例,爬取百度页面import requests #导入爬虫的库,不然调用不了爬虫的函数response = requests.get("http://www.baidu.com") #生成一个response对象response.encoding = response.apparent_encoding #设置编码格式print("状态码:"+ str( response.status_code ) ) #打印状态码print(response.text)#输出爬取的信息
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。