最近项目中用到websocket,在网上查了很多资料,整理一些,转到我的博客上,分享一下。
websocket与http
- WebSocket是HTML5出的东西(协议),也就是说HTTTP协议没有变化,或者说没有关系,但HTTP是不支持持久连接的(长连接,循环连接的不算)
- 首先HTTP有
1.1
和1.0
之说,也就是所谓的keep-alive
,把多个HTTP请求合并为一个,但是Websocket
其实是一个新协议,跟HTTP协议基本没有关系,只是为了兼容现有浏览器的握手规范而已,也就是说它是HTTP协议上的一种补充。 - 另外HTML5是指一系列新的API,或者说新规范,新技术。HTTP协议本身只有
1.0
和1.1
,而且跟HTML本身没有直接关系。。通俗来说,你可以用HTTP协议传输非HTML数据。再简单来说,层级不一样。
Websocket是什么样的协议,具体有什么优点
首先,Websocket是一个持久化的协议,相对于HTTP这种非持久来说。简单的举个例子吧,用目前应用比较广泛的PHP生命周期来解释。
HTTP的生命周期通过Request
来界定,也就是一个Request
一个Response
,那么在HTTP1.0
中,这次HTTP请求就结束了。
在HTTP1.1中进行了改进,使得有一个keep-alive,也就是说,在一个HTTP连接中,可以发送多个Request,接收多个Response。但是请记住Request = Response
,在HTTP中永远是这样,也就是说一个request只能有一个response。而且这个response也是被动的,不能主动发起。
首先Websocket是基于HTTP协议,或者说借用了HTTP的协议来完成一部分握手。首先我们来看个典型的Websocket握手
1 | GET /chat HTTP/1.1 |
熟悉HTTP的童鞋可能发现了,这段类似HTTP协议的握手请求中,多了几个东西。我会顺便讲解下作用。
1 | Upgrade: websocket |
这个就是Websocket的核心了,告诉Apache
、Nginx
等服务器:注意啦,我发起的是Websocket协议,快点帮我找到对应的助理处理~不是那个老土的HTTP
1 | Sec-WebSocket-Key: x3JJHMbDL1EzLkh9GBhXDw== |
首先,Sec-WebSocket-Key
是一个Base64 encode
的值,这个是浏览器随机生成的,告诉服务器:泥煤,不要忽悠我,我要验证尼是不是真的是Websocket助理。
然后,Sec-WebSocket-Protocol
是一个用户定义的字符串,用来区别同URL下,不同的服务所需要的协议。简单理解:今晚我要服务A,别搞错啦~
最后,Sec-WebSocket-Version
是告诉服务器所使用的Websocket Draft
(协议版本),在最初的时候,Websocket协议还在Draft阶段,各种奇奇怪怪的协议都有,而且还有很多期奇奇怪怪不同的东西,什么Firefox和Chrome用的不是一个版本之类的,当初Websocket协议太多可是一个大难题。。不过现在还好,已经定下来啦~大家都使用的一个东西~脱水:服务员,我要的是13岁的噢
然后服务器会返回下列东西,表示已经接受到请求,成功建立Websocket啦!
1 | HTTP/1.1 101 Switching Protocols |
这个开始就是HTTP最后负责的区域了,告诉客户,我已经成功切换协议啦~
1 | Upgrade: websocket |
依然是固定的,告诉客户端即将升级的是Websocket
协议,而不是mozillasocket,lurnarsocket或者shitsocket。然后,Sec-WebSocket-Accept
这个则是经过服务器确认,并且加密过后的Sec-WebSocket-Key
。服务器:好啦好啦,知道啦,给你看我的ID CARD来证明行了吧。。后面的,Sec-WebSocket-Protocol
则是表示最终使用的协议。至此,HTTP已经完成它所有工作了,接下来就是完全按照Websocket协议进行了。具体的协议就不在这阐述了。
Websocket的作用
在讲Websocket之前,我就顺带着讲下long poll
和 ajax轮询
的原理。
ajax轮询
ajax轮询的原理非常简单,让浏览器隔个几秒就发送一次请求,询问服务器是否有新信息。
场景再现:
- 客户端:啦啦啦,有没有新信息(Request)
- 服务端:没有(Response)
- 客户端:啦啦啦,有没有新信息(Request)
- 服务端:没有。。(Response)
- 客户端:啦啦啦,有没有新信息(Request)
- 服务端:你好烦啊,没有啊。。(Response)
- 客户端:啦啦啦,有没有新信息(Request)
- 服务端:好啦好啦,有啦给你。(Response)
- 客户端:啦啦啦,有没有新消息(Request)
- 服务端:。。。。。没。。。。没。。。。没有(Response)–loop
long poll
long poll
其实原理跟ajax轮询
差不多,都是采用轮询的方式,不过采取的是阻塞模型(一直打电话,没有收到就不挂电话),也就是说,客户端发起连接后,如果没消息,就一直不返回Response给客户端。直到有消息才返回,返回完之后,客户端再次建立连接,周而复始。
场景再现:
- 客户端:啦啦啦,有没有新信息,没有的话就等有了才返回给我吧(Request)
- 服务端:额。。等待到有消息的时候。。来 给你(Response)
- 客户端:啦啦啦,有没有新信息,没有话就等有了才返回给我吧(Request)-loop
从上面可以看出其实这两种方式,都是在不断地建立HTTP连接,然后等待服务端处理,可以体现HTTP协议的另外一个特点,被动性。
何为被动性呢,其实就是,服务端不能主动联系客户端,只能有客户端发起。
简单地说就是,服务端是一个很懒的冰箱(这是个梗)(不会、不能主动发起连接),但是上司有命令,如果有客户来,不管多么累都要好好接待。说完这个,我们再来说一说上面的缺陷(原谅我废话这么多吧QAQ)从上面很容易看出来,不管怎么样,上面这两种都是非常消耗资源的。
ajax轮询 需要服务器有很快的处理速度和资源(速度)long poll 需要有很高的并发,也就是说同时接待客户的能力。(场地大小)
所以ajax轮询
和long poll
都有可能发生这种情况.
- 客户端:啦啦啦,有信息么?
- 服务端:月线正忙,请稍后再试(503Server Unavailable)
- 客户端:。。。。。好吧,啦啦啦,有新消息么?
- 服务端:月线正忙,请稍后再试(503Server Unavailable)
- 客户端:然后服务端在一旁忙的要死
言归正传,我们来说Websocket吧
通过上面这个例子,我们可以看出,这两种方式丢不是最好的方式,需要更多资源。
一种需要更快的速度,一种需要更多的’电话’。这两种都会导致‘电话’的需求越来越高。
哦对了,忘记说了HTTP还是一个状态协议。
通俗的说就是,服务器因为每天要接待太多客户了,是个健忘鬼,你一挂电话,他就把你的东西全忘光了,把你的东西全丢掉了。你第二次还得再告诉服务器一遍。
所以在这种情况下出现了,Websocket出现了。他解决了HTTP的这几个难题。首先,被动性,当服务器完成协议升级后(HTTP->Websocket),服务端就可以主动推进信息给客户端啦。所以上面的情景可以做如下修改。
- 客户端:啦啦啦,我要建立Websocket协议,需要的服务:chat,Websocket协议版本:17(HTTP Request)
- 服务端:ok,确认,已升级为Websocket协议(HTTP Protocols Switched)
- 客户端:麻烦你有信息的时候推送给我噢。。
- 服务端:ok,有的时候回告诉你的。
- 服务端:balabalabalabala
- 服务端:balabalabalabala
- 服务端:哈哈哈哈哈哈啊哈哈哈
- 服务端:笑死我了哈哈哈哈哈哈哈
就变成这样,只需要经过一次HTTP请求,就可以做到源源不断的信息传送了。(在程序设计中,这种设计叫做回调,即:你有信息了再来通知我,而不是傻乎乎的每次跑来问你)
这样的协议解决了上面同步有延迟,而且还非常消耗资源的这种情况。那么为什么他会解决服务器上消耗资源的问题呢?
其实我们所用的程序是要经过两层代理的,即HTTP协议在Nginx等服务器的解析下,然后再传送给相应的Handler(PHP等)来处理。简单地说,我们有一个非常快速的接线员(Nginx)
,他负责把问题转交给相应的客服(Handler)
。
本身接线员基本上速度是足够的,但是每次都卡在客服(Handler)了,老有客服处理速度太慢,导致客服不够。Websocket就解决了这样一个难题,建立后,可以直接跟接线员建立持久连接,有信息的时候客服想办法通知接线员,然后接线员在统一转交给客户。
这样就可以解决客服处理速度过慢的问题了。
同时,在传统的方式上,要不断的建立,关闭HTTP协议,由于HTTP是非状态型的,每次都要重新传输identity info
(鉴别信息),来告诉服务端你是谁。
虽然接线员很快速,但是每次都要听这么一堆,效率也会有所下降的,同时还得不断把这些信息转交给客服,不但浪费客服的处理时间,而且还会在网路传输中消耗过多的流量/时间。
但是Websocket只需要一次HTTP握手,所以说整个通讯过程是建立在一次连接/状态中,也就避免了HTTP的非状态性,服务端会一直知道你的信息,直到你关闭请求,这样就解决了接线员要反复解析HTTP协议,还要查看identity info的信息。
同时由客户主动询问,转换为服务器(推送)由信息的时候就发送(当然客户端还是等主动发送信息过来的。。),没有信息的时候后就交给接线员(Nginx),不需要占用本身速度就慢的客服(Handler)了。
转自:http://blog.csdn.net/frank_good/article/details/50856585?readlog