http协议的详细描述
HTTP的早期版本为HTTP/09,它适用于各种数据信息的简洁快速协议,但是其远不能满足日益发展各种应用的需要。但HTTP/09作为HTTP协议具有典型的无状态性:每个事务都是独立进行处理的,当一个事务开始就在客户与服务器之间建立一个连接,当事务结束时就释放这个连接。HTTP/09包含
Simple-Request&Simple-Responsed的报文结构。但是客户无法使用内容协商,所以服务器也无法返回实体的媒体类型。
1982年,Tim Berners-Lee提出了HTTP/10,在此后的不断丰富和发展中,HTTP/10成为最重要的面向事务的应用层协议。该协议对每一次请求/响应,建立并拆除一次连接。其特点是简单、易于管理,所以它符合了大家的需要,得到了广泛的应用。其缺点是仍会发生下列问题:对用户请求响应慢、网络拥塞严重、安全性等。
1997年形成的HTTP/11,也就是现在普遍使用的协议,在持续连接操作机制中实现流水方式,即客户端需要对同一服务器发出多个请求时,其实现在多数的网页都是有多部分组成(比如多张),可用流水线方式加快速度,流水机制就是指连续发出多个请求并等到这些请求发送完毕,再等待响应。这样就大大节省了单独请求对响应的等待时间,使我们得到更快速的浏览。
另外,HTTP/11服务器端处理请求时按照收到的顺序进行,这就保证了传输的正确性。当然,服务器端在发生连接中断时,会自动的重传请求,保证数据的完整性。
HTTP/11还提供了身份认证、状态管理和Cache缓存等机制。这里,我想特别提一下关于HTTP/11中的Cache缓存机制对HTTP/10的不足之处的改进,它严格全面,既可以减少时间延迟、又节省了带宽。HTTP/11采用了内容协商机制,选择最合适的用户的内容表现形式。
现在,很多地方都有用到的虚拟主机技术在HTTP/11中也可以实现。所谓的虚拟主机技术,就是同一主机地址实际对应多台主机。通俗的讲,当你同时在一个网站申请两个主页时,用协议分析仪可以发现其实这两个主页对应的是同一个IP地址。这样用多台完全相同的机器形成WWW服务器就可以提高处理的吞吐量。
传统的解决方案是改造域名服务器使其可以根据一定的算法将同一域名解释成不同的IP地址。分别对应虚拟主机的每台机器,其缺点是要求每台机器占用完全独立的IP地址,这与IP地址的缺乏是相矛盾的。
HTTP/11提供的解决方案在HTTP协议自身中加入了指定不同主机的功能,从而多台主机可以共享一个IP地址,既提高了性能又便于管理。
因为HTTP/11是Internet现行的标准协议,这里详细介绍其相关语法。
首先,HTTP/11格式可写为:
[img:8d94cc43ef]http://wwwchina-pubcom/computers/emook/0472/1gif[/img:8d94cc43ef]
其中请求方法是请求一定的Web页面的程序或用于特定的URL。可选用下列几种:
GET: 请求指定的页面信息,并返回实体主体。
HEAD: 只请求页面的首部。
POST: 请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。
PUT: 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE: 请求服务器删除指定的页面。
OPTIONS: 允许客户端查看服务器的性能。
TRACE: 请求服务器在响应中的实体主体部分返回所得到的内容。
PATCH: 实体中包含一个表,表中说明与该URI所表示的原内容的区别。
MOVE: 请求服务器将指定的页面移至另一个网络地址。
COPY: 请求服务器将指定的页面拷贝至另一个网络地址。
LINK: 请求服务器建立链接关系。
UNLINK: 断开链接关系。
WRAPPED: 允许客户端发送经过封装的请求。
Extension-mothed:在不改动协议的前提下,可增加另外的方法。
比如:
GET /indexhtml HTTP/11
Accept: text/plain /纯ASCII码文本文件/
Accept: text/html /HTML文本文件/
User-Agent:Mozilla/45(WinNT)
说明浏览器使用Get方法请求文档/indexhtml。浏览器则只允许接收纯ASCII码文本文件和HTML文本文件,其使用的引擎是Mozilla/45(Netscape)。
当服务器响应时,其状态行的信息为HTTP的版本号,状态码,及解释状态码的简单说明。现将5类状态码详细列出:
① 客户方错误
100 继续
101 交换协议
② 成功
200OK
201已创建
202 接收
203 非认证信息
204 无内容
205重置内容
206 部分内容
③ 重定向
300多路选择
301 永久转移
302 暂时转移
303 参见其它
304未修改(Not Modified)
305 使用代理
④ 客户方错误
400 错误请求(Bad Request)
401未认证
402需要付费
403 禁止(Forbidden)
404 未找到(Not Found)
405 方法不允许
406 不接受
407 需要代理认证
408 请求超时
409 冲突
410失败
411需要长度
412 条件失败
413请求实体太大
414请求URI太长
415不支持媒体类型
⑤ 服务器错误
500 服务器内部错误
501 未实现(Not Implemented)
502 网关失败
504网关超时
505 HTTP版本不支持
比如:(在《TELNET……》一文中用telnet登陆80端口,相同的方法用在HTTP/11中,会发现没有显示,下面补充说明之)
telnet wwwfudaneducn 80
HEAD / HTTP/11
host:wwwfudaneducn /本行为输入内容/
HTTP/11 501 Method Not Implemented
Date: Web, 01 Nov 2000 07:12:29 GMT /当前的日期/时间/
Server: Apache/1312 (Unix) /Web服务器信息/
Allow: GET, HEAD, OPTION, TRACE /支持的方法类型/
Connection: close
Connect-Type: Text/html; charset=iso-8859-1/连接的媒体类型/
<!DOCTYPE HTML PUBLIG "-//IETF//DTD HTML 20//EN">
<HTML><HEAD>
<TITLE>501 Method
Not Implemented</TITLE>
</HEAD><BODY>
<H1>Method Not Implemented</H1>
head to /inde
xhtml not supported<P>
Invalid method in request head / htp/11<P>
<HR>
<ADDRESS>
Apache/1312 Server at wwwfudaneducn Port 80</ADDRESS>
</BODY></HTML>
关于实体头部的内容还可以有:
Last Modified :请求文档的最近修改时间。
Expires :请求文档的过期时间。
Connect-length:文档数据的长度。
WWW-authenricate:通知客户端需要的认证信息。
Connect-encoding :说明有无使用压缩技术。
Transfer-encoding :说明采用的编码变换类型。
随着Internet的发展,下一代的HTTP协议HTTP-ng已经在酝酿之中,它将会提供更好的安全性、更快的速度,其改进要点为:模块化强、网络效率高、安全性更好、结构更简单。
0条评论