赞
踩
你可以使用 Python 的 urllib
库来下载网页文件。具体的方法是:
urllib.request.urlopen
函数打开网页链接,这会返回一个文件对象。read
方法读取文件内容。open
函数)将文件内容写入本地文件。下面是一个简单的示例代码:
- import urllib.request# 打开网页链接
- response = urllib.request.urlopen("http://www.example.com/index.html")
-
- # 读取网页内容
- html = response.read()
-
- # 将网页内容写入本地文件
- with open("index.html", "w") as f:
- f.write(html)
注意,这里的 html
变量是一个字节类型的字符串,如果你需要转换为文本,可以使用 html.decode
方法将其转换为字符串。
text = html.decode("utf-8")
还有一些注意事项:
requests
)或者设置 HTTP 头信息来伪装成浏览器。gzip
库解压缩文件内容。Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。