http 全称为 hypertext transfer protocol,翻译为中文是“超文本传输协议”的意思,它是互联网中应用最为广泛的一种网络协议。自 1990 年万维网(也就是互联网)诞生以来,http 就成为万维网通信的基础协议。http 协议是由万维网之父蒂姆·贝纳斯·李(tim berners-lee)提出的,随后他还成立了万维网联盟(www consortium),并组织了 ietf(internet engineering task force)小组来进一步完善和发布 http 协议。
http简介
http 是一个简单的请求/响应协议,通常运行在 tcp(transmission control protocol 的简称,是一种面向连接的、可靠的、基于字节流的传输层通信协议)之上。http 协议指定了客户端能够发送什么样的消息给服务端,以及服务端要做出怎样的响应。
http 协议是基于 b/s 架构(全称为 browser/server,中文是浏览器/服务器的意思)进行通信的,协议中服务器端的实现程序主要是 httpd、nginx 等,客户端的实现程序通常是 web 浏览器,例如 firefox、google chrome 等。服务器端的服务是基于 tcp 的,因此为了能够随时响应客户端的请求,服务器会默认监听 tcp 协议的 80 端口,当然后期您也可以修改为其它端口。
http 协议为计算机之间的通信提供了一种标准和规范,它规定了:
如何构造客户端的请求数据(也称报文);
如何将请求数据发送到服务器;
服务器端如何响应客户端的请求。
总的来说,http 协议规定了万维网时代计算机通信的完整流程以及各种细节。
http协议的特点
1) 简单快速
http 协议支持客户端、服务器端模式,简单快速,当客户端向服务器端发送请求时,只需要传送请求方法和路径即可,常用的请求方法有 get、head、post 等,每种方法都定义了客户端与服务器之间不同的信息交换方式。
2) 灵活
http 允许传输任意类型的数据对象,包括音频、视频、图片、文本等等。
3) 无连接
http 是无连接的,当服务器接受到来自客户端的请求后,会按顺序依次处理这些请求,处理完成一个就关闭一个,然后开始处理下一个请求。无连接的含义是限制每次连接只处理一个请求。服务器处理完客户端的请求,并收到客户端的应答后,随即断开连接,采用这种方式可以节省传输时间。
4) 无状态
http 协议是无状态协议,无状态是指协议对于信息的处理没有记忆能力。也就是说来自同一个客户端的多个请求之间没有上下文关系,每次的请求都是独立的,一次请求的执行情况和结果与它前面的请求或后面的请求没有直接关系。
服务器中并不会保存客户端的状态,也就意味着如果后续处理中需要用到前面的信息,那么您就需要将它重新发送到服务端,这样可能会导致每次连接传送的数据量增大。但从另一方面来讲,如果服务器不需要先前信息时它的响应就会比较快。
http协议的发展历程
1) http/0.9
http/0.9 是 1991 年 http 的原型版本,这个版本的协议存在许多设计缺陷并且只能使用老旧的客户端进行操作。
http/0.9 只支持 get 方法,而且响应信息中只有数据,没有版本号、状态码、响应头等信息,并且不支持使用 mime 类型来指定多媒体内容。
http/0.9 原本是用来获取简单的 html 数据对象的,所以很快就被 http/1.0 所取代。
2) http/1.0
在 1996 年,timberners-lee 提出了 http/1.0,它是第一个被广泛使用的版本。在此后的不断丰富和发展中,http/1.0 成为最重要的面向事务的应用层协议。其特点是简单、易于管理,符合了大家的需要,得到了广泛的应用。
http/1.0 几乎可以传输任何类型的文件,这使得我们在网页中不仅可以展示文字,还可以展示图像、音频、视频等二进制文件,这为互联网的兴起奠定了基础。
3) http/1.1
http/1.1 是目前我们所使用的版本,它纠正了 http 在设计上的缺陷,规范了语义,引入了重要的性能优化,去除了某些错误的功能。并且它还为更加复杂的 web 应用程序提供支持。
4) http/2.0
http/2.0 又称为 http/ng,它是下一代 http 协议,目前应用还非常少。http/2.0 使用了多路复用的技术,做到同一个连接并发处理多个请求,而且并发请求的数量比 http/1.1 大了好几个数量级。
http/2.0 是一个二进制协议,头信息和数据体都是二进制,并且统称为“帧”(frame),即头信息帧和数据帧。而且 http/2.0 协议允许服务器在未经请求的情况下,主动向客户端发送资源,即服务器推送。
http的工作流程
一次完整的 http 请求与响应的过程(请求和响应缺一不可)称为一个 http 事务,其过程大致可分为四步:
首先客户端与服务器需要建立连接,比如当我们单击网页中的某个链接时;
建立连接后,客户端向服务器发送一个请求;
服务器在接收到请求后,给予相应的响应信息;
客户端接收到服务器所返回的信息后与服务器断开连接。
提示:如果以上过程中的某一步出现错误,那么服务器会将产生错误的信息返回给客户端。对于用户来说,这些过程都是由 http 自己完成的,我们只要用鼠标点击,等待信息显示就可以了。
客户端与服务器之间的 http 连接是一种一次性连接,它限制每次连接只处理一个请求,当服务器返回本次请求后便立即关闭连接,下次请求再重新建立连接。这种一次性连接主要是因为服务器要面向成干上万个网络中用户,而且服务器只能提供有限个连接,所以服务器不会让一个连接处于等待状态,及时地释放连接可以大大提高服务器的执行效率。
http 是一种无状态协议,即服务器不保留与客户端连接时的任何状态。这就大大减轻了服务器的记忆负担,从而保持较快的响应速度。http 是一种面向对象的协议,允许传送任意类型的数据对象,它通过数据类型和长度来标识所传送的数据内容和大小,并允许对数据进行压缩传送。
http 规范定义了 9 种请求方法,每种请求方法规定了客户和服务器之间不同的信息交换方式,常用的请求方法是 get 和 post。服务器将根据客户请求完成相应操作,并将最终结果返回给客户端,最后关闭连接。