WebSocket协议
WebSocket
HTTP是请求响应
模型,在这个模型下服务器端是不能主动发消息给客户端的。这在很多场景下有诸多不便,例如消息通知等。为了解决这个问题,WebSocket
应运而生。
在没有WebSocket
之前,我们主要通过轮询来实现消息推送。为了提高消息的实时性
我们要提高轮询频率,轮询频率提高后会给系统造成一些压力。
协议实现
在浏览器中WebSocket通过HTTP的协议升级来实现。要发起 HTTP/1.1 协议升级,客户端必须在请求头部中指定这两个字段:
1 | Connection: Upgrade |
如果服务端不同意升级或者不支持 Upgrade 所列出的协议,直接忽略即可(当成 HTTP/1.1 请求,以 HTTP/1.1 响应);如果服务端同意升级,那么需要这样响应:1
2
3
4
5HTTP/1.1 101 Switching Protocols
Connection: upgrade
Upgrade: protocol-name[/protocol-version]
[... data defined by new protocol ...]
协议完成升级后就和HTTP协议没有关系了,剩下的数据都以WebSocket
协议进行传输。
下面是一个通过HTTP建立WebSocket请求的例子:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20# 请求头
GET ws://example.com/ HTTP/1.1
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cache-Control: no-cache
Connection: Upgrade
Host: 127.0.0.1:8081
Origin: http://example.com
Pragma: no-cache
Sec-WebSocket-Extensions: permessage-deflate; client_max_window_bits
Sec-WebSocket-Key: /3ZaE3COLK+dw4pHqCTarQ==
Sec-WebSocket-Version: 13
Upgrade: websocket
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36
# 响应头
HTTP/1.1 101 Switching Protocols
connection: upgrade
sec-websocket-accept: EMUWrlnRHG2LyGmmWMuWoFyBxnI=
upgrade: websocket
字段说明:
- Connection必须设置Upgrade,表示客户端希望连接升级。
- Upgrade字段必须设置WebSocket,表示希望升级到WebSocket协议。
- Sec-WebSocket-Key是随机的字符串,服务器端会用这些数据来构造出一个SHA-1的信息摘要。把
Sec-WebSocket-Key
加上一个特殊字符串258EAFA5-E914-47DA-95CA-C5AB0DC85B11
,然后计算SHA-1摘要,之后进行BASE-64编码,将结果做为Sec-WebSocket-Accept
头的值,返回给客户端。如此操作,可以尽量避免普通HTTP请求被误认为WebSocket协议。 Sec-WebSocket-Version
表示支持的WebSocket版本。RFC6455要求使用的版本是13,之前草案的版本均应当弃用。- Origin字段是可选的,通常用来表示在浏览器中发起此WebSocket连接所在的页面,类似于Referer。但是,与Referer不同的是,Origin只包含了协议和主机名称。
- 其他一些定义在HTTP协议中的字段,如Cookie等,也可以在WebSocket中使用。
握手
要使用WebSocket首先得让客户端和服务器建立连接,首先需要通过验证KEY来做握手工作。
这个握手协议使用的是HTTP格式的请求,并再头部分带上一个Sec-WebSocket-Key
字段,服务器对这个字段加上一个特定的字符串后做一次sha1运算,然后把结果用Base64的形式以同样的方式发送回去就可以完成握手的工作了。
1 | // ws-handshake.js |
解析数据帧
WebSocket数据包不像HTML是纯文本形式的,它是一个二进制的协议包。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-------+-+-------------+-------------------------------+
|F|R|R|R| opcode|M| Payload len | Extended payload length |
|I|S|S|S| (4) |A| (7) | (16/64) |
|N|V|V|V| |S| | (if payload len==126/127) |
| |1|2|3| |K| | |
+-+-+-+-+-------+-+-------------+ - - - - - - - - - - - - - - - +
| Extended payload length continued, if payload len == 127 |
+ - - - - - - - - - - - - - - - +-------------------------------+
| |Masking-key, if MASK set to 1 |
+-------------------------------+-------------------------------+
| Masking-key (continued) | Payload Data |
+-------------------------------- - - - - - - - - - - - - - - - +
: Payload Data continued ... :
+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
| Payload Data continued ... |
+---------------------------------------------------------------+
FIN: 1 bit
指示这个是消息的最后片段。第一个片段可能也是最后的片段。
RSV1, RSV2, RSV3: 1 bit each
预留字段,默认为0。
Opcode: 4 bits
表示数据的类型。
%x0 denotes a continuation frame
%x1 denotes a text frame
%x2 denotes a binary frame
%x3-7 are reserved for further non-control frames
%x8 denotes a connection close
%x9 denotes a ping
%xA denotes a pong
%xB-F are reserved for further control frames
Mask: 1 bit
1位。
标识这个数据帧的数据是否使用掩码,值为1表示使用掩码。从客户端发送的数据都为1。
Payload length: 7 bits, 7+16 bits, or 7+64 bits
7位。表示数据的长度。
PayloadLength只有7位,换成无符号整型的话只有0到127的取值,这么小的数值当然无法描述较大的数据,因此规定当数据长度小于或等于125时候它才作为数据长度的描述,如果这个值为126,则时候后面的两个字节(16位)来储存储存数据长度,如果为127则用后面八个字节(64位,最高有效位必须是0)来储存数据长度。
Masking-key: 0 or 4 bytes
Mask
的值为1
时才有Masking-key
。Payload
如果使用了掩码所有数据就需要和掩码做异或(^)运算。
1
2j = i MOD 4
transformed-octet-i = original-octet-i XOR masking-key-octet-j1
for (var i = 0, ret = []; i < payload.length; i++) ret.push(payload[i] ^ MaskingKey[i % 4]);
示例:1
2let ws = new WebSocket('ws://example.com/');
ws.send('ok');
1 | bits: 1000 0001 1 0000010 00101011-01101000-10101000-11100111 0100010000000011 |
1 | function decodeWebSocketFrame(msg) { |
生成数据帧
1 | function encodeWebSocketFrame(frame) { |
关闭连接
WebSocket连接关闭时需要两者协商。客户端调用close
方法会给服务器端先发送一个数据帧,该数据帧opcode
为0x8
。如果payload
不为空,它的payload
头两个字节为状态码,后面的是关闭连接的原因。服务器断开连接后才会触发close
事件。
1000
1000表示正常关闭,意思是建议的连接已经完成了。
1001
1001表示端点“离开”(going away),例如服务器关闭或浏览器导航到其他页面。
1002
1002表示端点因为协议错误而终止连接。
1003
1003表示端点由于它收到了不能接收的数据类型(例如,端点仅理解文本数据,但接收到了二进制消息)而终止连接。
1004 保留。可能在将来定义其具体的含义。
1005
1005是一个保留值,且不能由端点在关闭控制帧中设置此状态码。它被指定用在期待一个用于表示没有状态码是实际存在的状态码的应用中。
1006
1006是一个保留值,且不能由端点在关闭控制帧中设置此状态码。它被指定用在期待一个用于表示连接异常关闭的状态码的应用中。
1007
1007表示端点因为消息中接收到的数据是不符合消息类型而终止连接(比如,文本消息中存在非UTF-8[RFC3629]数据)。
1008
1008表示端点因为接收到的消息违反其策略而终止连接。这是一个当没有其他合适状态码(例如1003或1009)或如果需要隐藏策略的具体细节时能被返回的通用状态码。
1009
1009表示端点因接收到的消息对它的处理来说太大而终止连接。
1010
1010表示端点(客户端)因为它期望服务器协商一个或多个扩展,但服务器没有在WebSocket握手响应消息中返回它们而终止连接。 所需要的扩展列表应该出现在关闭帧的/reason/部分。
注意,这个状态码不能被服务器端使用,因为它可以失败WebSocket握手。
1011
1011表示服务器端因为遇到了一个不期望的情况使它无法满足请求而终止连接。
1015
1015是一个保留值,且不能由端点在关闭帧中被设置为状态码。它被指定用在期待一个用于表示连接由于执行TLS握手失败而关闭的状态码的应用中(比如,服务器证书不能验证)。
状态转变
客户端共有四种状态CONNECTING
(0)、OPEN
(1)、CLOSEING
(2)、CLOSED
(3),调用readyState
可以查看具体的状态。
创建WebSocket
对象后处于CONNECTING
状态,完成协议升级后变为OPEN
状态。调用close()
方法后处于CLOSEING
状态,连接断开后变为CLOSED
状态。