赞
踩
学习环境:python 2.7 windows10
一、 requests get 请求
1.获得一个get请求
r = requests.get("http://www.hactcm.edu.cn"
2.获得网页文本
print r.text
输出结果
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html><head><title>æ²³å—ä¸åŒ»è¯å¤§å¦ä¸æ–‡ç½‘</title>
<meta http-equiv="X-UA-Compatible" content="IE=EmulateIE7" />
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type"><link rel="stylesheet" type="text/css" href="style/style.css">
<style>
3.可以看到乱码。打印requests获得的网页编码
print r.encoding
输出结果是
ISO-8859-1
4.可以知道正确编码未获得可以手工指定编码
r.encoding='utf-8'
5.重新获得网页文本
print r.text
输处的网页文本
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html><head><title>河南中医药大学中文网</title>
<meta http-equiv="X-UA-Compatible" content="IE=EmulateIE7" />
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type"><link rel="stylesheet" type="text/css" href="style/style.css">
<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。