赞
踩
HTTP,全称是 HyperText Transfer Protocol,中文叫做超文本传输协议。它是一种用于分布式、协作式和超媒体信息系统的应用层协议。
HTTP 是一个客户端(用户)和服务器端(网站)请求和应答的标准(TCP)。
通过使用网页浏览器、网络爬虫或者其他工具,客户端发起一个 HTTP 请求到服务器上指定的端口(默认端口为 80),我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储这一些资源,比如 HTML文件、图像等,我们称这个应答服务器为源服务器(origin server)。在用户代理程序和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。
尽管 TCP/IP 协议是互联网上最流行的应用,但在 HTTP 协议中,并没有规定必须使用它或者他支持的层。事实上,HTTP 可以在任何互联网协议上,或者其他网络上实现。HTTP 假定其下层协议提供可靠的传输。因此,任何能够提供这种保证的协议都可以被其使用。因此,也就是其在 TCP/IP 协议族使用 TCP 作为其传输层。
通常,由 HTTP 客户端发起一个 请求,创建一个到服务器指定端口(默认为 80)的 TCP 连接。HTTP 服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如 “HTTP/1.1 200 OK”,以及返回的内容,如请求的文件、错误信息、或者其他信息。
HTTP 协议定义 Web 客户端如何从 Web 服务器请求 Web 页面,以及服务器如何把 Web 页面传送给客户端。HTTP 协议采用了“请求/响应模型”。
客户端想服务器发送一个请求报文,请求报文包含了请求方法、URL协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或错误代码、服务器信息、响应头部和响应数据。
HTTP 报文可以分为两类:请求报文(request message)和响应报文(response message),两者的基本报文结构相同。
请求报文的格式:
<method> <request-URL> <version><headers><entiry-body>
响应报文格式:
<version> <status> <reason-phrase><headers><entity-body>
报文对应表示:
> // method: 客户端希望服务器对资源执行的动作。是一个单独的词,比如 GET、HEAD 或 POST;
> // request-URL:命名了所请求的资源,或者 URL 路径组件的完整 URL
> // version: 报文所使用的 HTTP版本,格式:HTTP/<major>.<minor>,主版本号和次版本号都是整数
> // headers: 首部,可以有零个或多个首部,毎个首部都包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个CRLF。首部是由一个空行(CRLF)结束的,表示了首部列表的结束和实体主体部分的开始
> // entity-body:主体部分,包含一个由任意数据组成的数据块,并不是所有的报文都包含实体的主体部分,有时报文是已一个 CRLF 结束的。
注意:请求行、响应行的每个字段都是由“空格符”进行分割的。
客户端连接到 Web 服务器
一个 HTTP 客户端。通常是浏览器,与 Web 服务器的 HTTP 端(默认为 80)建立一个 TCP 套接字连接。如:http://www.baidu.com;
发送 HTTP 请求
通过 TCP 套接字,客户端向 Web 服务器发送一个文本的请求报文,一个请求报文包括请求行、请求头部、空行和请求数据 4 部分组成。
服务器接受请求并返回 HTTP 响应
Web 服务器解析请求,定位请求资源。服务器将资源副本写到 TCP 套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据 4 部分组成。
释放 TCP 连接
如果 connect 模式为 close,则服务器阻断关闭 TCP 连接,客户端被动关闭连接,释放 TCP 连接;如果 connection 模式为 keepalive,则该连接会保持一段时间,在改时间内可以继续接收请求。
客户端浏览器解析 HTML 内容。
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码,然后解析每一个响应头,响应头告知以下为若干字节的 HTML 文档和文档的字符集。客户端浏览器读取响应数据 HTML,根据 HTML 语法堆砌进行格式化,并在浏览器窗口中显示。
GET:获取资源。可以理解为 “取”的意思,对应select操作。用来获取数据的,只是用来查询数据,不对服务器的数据做任何的修改,新增,删除等操作。
POST:传输实体主体。可以理解为 “贴”的意思。数据发送到服务器以创建或更新资源,侧重于更新数据,对应update操作。post请求的请求参数都是请求body中。
PUT:传输文件。可以理解为“放”的意思。数据发送到服务器以创建或更新资源,侧重于创建数据,对应insert操作。
HEAD:获取报文首部。无需传输整个内容
DELETE:删除文件
OPTIONS:询问支持的方法
TRACE:追踪路径
CONNECT:要求用隧道协议连接代理
1、GET:向指定的资源发出“显示”请求。使用GET方法应该只用在读取数据,而不应当被用于产生“副作用”的操作中,例如在Web Application中。其中一个原因是GET可能会被网络蜘蛛等随意访问。
2、HEAD:与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
3、PUT:向指定资源位置上传其最新内容。
4、POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。
5、TRACE:回显服务器收到的请求,主要用于测试或诊断。
6、OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用’*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。
7、DELETE:请求服务器删除Request-URI所标识的资源。
8、CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。
注意:
方法名称是区分大小写的。当某个请求所针对的资源不支持对应的请求方法的时候,服务器应当返回状态码 405(Method Not Allowed),当服务器不认识或者不支持对应的请求方法的时候,应当返回状态码 501(Not Implemented)。
GET 提交的数据大小有限制(因为浏览器对 URL 的长度有限制),而 POST 方法提交的数据没有限制.
HTTP 状态码被分成了“五”大类,不同的类型代表不同类别的状态码。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。