SPDY:Google开发的下一代HTTP协议

概述

​SPDY​​​是Google宣布正在开发的下一代网络协议,​​SPDY​​​并不是一种用于替代HTTP的协议,而是对HTTP协议的增强。HTTP自上世纪90年代问世以来,已有二十年的历史,期间互联网本身发生了很大的变化,也使得HTTP的许多不足暴露了出来,现在它已经不能满足许多web app的要求。Google表示,引入​​SPDY​​​协议后,在实验室测试中页面加载速度比原先快64%,并且目前已经在Gmail等应用中使用。目前业界支持SPDY的服务器有​​Netty​​和​​Nginx​​(将要支持)。Nginx 官方发布下一个版本 1.3.0 的路线图,该版本将支持 Google SPDY

 


 

Google之所以要改动HTTP协议而不是TCP/IP,是因为改变HTTP只需更新Browser和web server就行了,而改动TCP/IP就困难多了,牵扯面太广,需要更新巨量的路由器,服务器和客户端的操作系统。

SPDY的设计特点

​SPDY​​的设计特点是在SSL层的基础上,增加了一个session 层,从而在一个tcp 连接基础上,实现了多并发和交叉流传输。HTTP 的GET ,POST 仍旧采用旧有的消息格式,当然SPDY 协议对原有的数据做了封装和编码,这里采用Wrapper设计模式。


​SPDY​​的目标就是通过其基本特性和高级特性,来达到低访问延迟。

SPDY的特性

1、流复用

SPDY最牛逼的地方,是允许在一个TCP连接里面,允许无限并发流(在双方资源可承受的情况下)。因为请求是在一个单一的通道交错传输,TCP的可以达到很高的效率,从而更少的网络连接需要,可以以很高的 数据密度做传输。

2、优先级

虽然无限的并行数据流的解决了序列化的问题,但是它们引入了另一个问题:如果由于信道带宽的 限制,客户端可能会阻止怕堵塞通道的要求。为了克服这个问题,SPDY实现请求的优先次序:客户端可以请求尽可能多的项目,每个请求分配一个优先级。这样 即使高优先级的请求仍处在pending状态,通道也不会传输非关键的,低优先级的请求,这样就有效地阻止了传输拥塞。

3、Http header压缩

对于HTTP 请求,响应头,SPDY都做了压缩,这样包更小,对于RESTFUL类型的WEB2.0 ,or OpenAPI 业务,将会有可观的效率提升。

4、服务器端推送

SPDY通过X-Associated-Content 协议头来向客户端推送数据,头通知客户端,我要向你推送资源,准备接收好了。最近火爆的Google+ ,如果你用chrome浏览器,默认就采用SPDY技术,并且开启了服务器推送技术。服务器的推技术,全面提升了用户体验,是G+ 产品很快占据了足够多的优势,最近Facebook 开发自己的浏览器,也有摆脱现在技术限制的考虑。

5、Server hint

不像上面提到的PUSH 技术,服务器会先告诉浏览器,你可以下载ABC资源了,这个ABC资源,可能就是下一个页面的JS ,CSS ,或者内容。服务器不会主动推送的,仍旧等待客户端请求,这对于低速网络,是个很大的优化,有点类似于我们的预加载技术。

6、安全防攻击

这点在官网上没有介绍到,但由于​​SPDY​​​采用了SSL+数据压缩,安全性上有了很大提升。尤其很多国家的网络审查将很难使用。这是否会成为​​SPDY​​发展的一个限制呢?

 

 

工作机制

从SPDY协议的设计角度来看,它在HTTP和SSL层之间增加了一个SPDY会话层,原有的GET和POST请求的格式都不变,SPDY会话层会把请求 封装成一个SPDY frame(SPDY帧,下一篇文章进行介绍),然后把SPDY帧丢给ssl层或者tcp层发送,这样做一方面是为了尽量兼容现有的HTTP协议,另一方面也主要是让SPDY协议易于部署,对应用层来说是透明的。

 

在SPDY协议有几个概念是比较重要的:

1、session--会话,一个SPDY会话实质上就是一个tcp连接
2、stream--虚拟流,一个SPDY会话可以拥有多条虚拟流,每条流都有标识其身份的流ID,所有的请求和应答都是通过流进行的
3、frame--SPDY帧,在SPDY协议中,客户端和服务器交互的数据就是SPDY帧,SPDY帧可以分为控制帧和数据帧,数据帧和控制帧通过帧的第一个比特位进行区分,帧的具体结构这里就不分析了,有兴趣的同学可以去查看google发布的SPDY草案。

 

首先来看下SPDY协议中的http请求和应答格式,为了与当前的web应用尽可能的兼容,SPDY协议基本上保留了http请求头和响应头语义,主要的变化有以下几点:
1、请求和应答头中的connection和keep-alive不再有效,即使存在也会被忽略,host头也会被忽略
2、默认并且强制使用gzip压缩
3、http请求和应答报头都将被压缩

当用户请求打开一个网页,SPDY会话层会向web服务器发起一个tcp连接,(在spdy协议中所有的tcp连接都是长连接,客户端一般不会断开连接,除非用户离开当前页面,跳向另一个页面,连接的断开由服务器负责, 服务器会关掉那些长时间处于空闲的连接),建立tcp连接后,客户端和服务器就会开始进行帧的交互。


首先客户端为了发送http请求,需要与服务端建立虚拟流连接,建立 流连接的过程和tcp建立连接的过程很相似,如上图所示,客户端发送SYN_STREAM控制帧,控制帧中可以包含流优先级,高优先级流中的请求将会被服 务器优先处理,服务器收到SYN_STREAM帧后将回复SYN_REPLY帧表示连接建立,这里要注意的是,客户端不需要等待SYN_REPLY帧,就 可以直接在该条流上发送数据帧。
当连接建立后,双方就可以在流上发送数据了。
当一方发送数据完毕后,就可以发送一个带有FIN_FLAG标志的帧,表示不会在该流上发送数据,流连接处于半关闭状态,如果双方都处于半关闭状态时,流就会被认为结束了,另外有个FIN_STREAM控制帧用于主动或者异常情况下结束流的传输。

 

 

与http协议相比

HTTP 1.1协议的不足:

1、一个连接同时只能处理一个请求。

也就是说,一个HTTP连接一次只能请求一个资源,即使是长连接,下 一个资源的请求也只能等到上一个请求完成后才能执行,服务器的端到端延迟使得tcp的重用率很低。为了提高网页加载速度,浏览器则通过建立多条连接来同时 请求多个资源,(当前浏览器设置每个域的连接数为6个),这会带来一定的开销,而且请求的连接数也是有限的。

2、HTTP请求和响应头未压缩

随着互联网应用越来越多的使用cookie和useragents等 扩展特性,当前HTTP的请求和响应头越来越大,请求头部大小达到700-800bytes已经很常见了,甚至还有达到2kb的,对于低带宽的网络,这会 带来很大的延迟,减小头部的大小可以有效的降低数据传输延迟。

3、HTTP冗余头部

有些HTTP头比如User-Agent,Host和Accept等会重复的发送,这些字段基本上是不变的,没有必要进行重复发送。

4、只有客户端才能发送请求

在现在的HTTP协议中,只有客户端才能主动的发起请求,服务器端即使知道客户端需要哪些资源,它也不能主动的发送,只能等待客户端发起对该资源的请求。

SPDY协议认为以上不足严重影响了网页的下载速度,针对这些不足的地方SPDY协议主要进行了以下四个方面的改进(即四个特性):

 

1、在一个SPDY连接中允许建立多条stream(虚拟流),并发发送多个HTTP请求,请求个数是没有限制的,这里涉及到连接中虚拟流的概念,下一篇文章会对虚拟流进行介绍的,嘿嘿

2、HTTP请求可以具有优先级,也就是说客户端可以要求服务器优先发送重要的资源,这就避免了一个处理时间很长的非关键请求阻塞了服务器对后面请求的处理,影响网页的加载速度

3、SPDY协议允许压缩头部,减小HTTP头部的大小,减小对带宽的占用

4、服务器可以主动的给客户端发送数据,不需要客户端的主动请求

 

 

具体详情可见:

Using SPDY and HTTP transparently using Netty

 

​http://www.smartjava.org/content/using-spdy-and-http-transparently-using-netty​