在MQTT协议中,一个控制报文(数据包)的结构按照前后顺序分如下三部分:
结构名 | 中文名 | 解释说明 |
Fixed header | 固定报头 | 报文的最开始部分,所有报文都包含这个部分 |
Variable header | 可变报头 | 固定报文的附加部分,有些报文没有这个部分 |
Payload | 有效载荷 | 需要携带的信息内容,有些报文没有这个部分 |
下图是MQTT控制报文(数据包)格式的结构示意图:
1、固定报头(Fixed header):
固定报头存在于所有MQTT数据包中,表示数据包类型及控制类标志等。固定报头由至少2个字节组成,格式如下:
Bit(位号) | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 |
Byte1(第一个字节) | 组合代表MQTT控制报文(数据包)的类型 | 控制报文的标志位(Flags),可理解为一种属性参数 | ||||||
Byte2(第二个字节起) | 剩余长度,当前报文剩余部分的字节数,包括可变报头和有效负载 |
1.1、控制报文类型(Control Packet type):
固定报头第一个字节的高四位(7-4号位)是代表控制报文的类型,也就是这个数据包是做什么用的。是用7-4号位的二进制(也就是1111–0000之间)组合值,来代表具体的含义,见下表:
7-4号位 | 十进制值 | 报文类型 | 报文允许发起方向 | 报文描述 |
0000 | 0 | Reserved | 禁止 | 保留,不可用 |
0001 | 1 | CONNECT | 客户端―→服务端 | 客户端请求连接到服务端的代理服务 |
0010 | 2 | CONNACK | 客户端←―服务端 | 连接请求的回复确认报文 |
0011 | 3 | PUBLISH | 客户端←→服务端 | 发布主题消息 |
0100 | 4 | PUBACK | 客户端←→服务端 | 发布确认,是QoS=1时,对 PUBLISH 的响应确认 |
0101 | 5 | PUBREC | 客户端←→服务端 | 发布收到,是QoS=2时,对 PUBLISH 的响应确认,是QoS=2实现的第一步 |
0110 | 6 | PUBREL | 客户端←→服务端 | 发布释放,是QoS=2时,对 PUBREC 的响应确认,是QoS=2实现的第二步 |
0111 | 7 | PUBCOMP | 客户端←→服务端 | 发布完成,是QoS=2时,对 PUBREL 的响应确认,是QoS=2实现的第三步 |
1000 | 8 | SUBSCRIBE | 客户端―→服务端 | 客户端订阅主题,可一次订阅一个或多个主题(使用通配符) |
1001 | 9 | SUBACK | 客户端←―服务端 | 订阅完成确认,是对 SUBSCRIBE 的响应确认 |
1010 | 10 | UNSUBSCRIBE | 客户端―→服务端 | 取消订阅,客户端发起的取消对某个主题的订阅 |
1011 | 11 | UNSUBACK | 客户端←―服务端 | 取消订阅确认,是对 UNSUBSCRIBE 的响应确认 |
1100 | 12 | PINGREQ | 客户端―→服务端 | 心跳,表示这个数据包是为通知服务端客户端还在正常连接着 |
1101 | 13 | PINGRESP | 客户端←―服务端 | 心跳响应,表示服务端已经成功收到了客户端的心跳 |
1110 | 14 | DISCONNECT | 客户端―→服务端 | 断开连接,客户端通知服务端,需要断开当前网络连接 |
1111 | 15 | Reserved | 禁止 | 保留,不可用 |
1.2、标志(Flags):
固定报头第1个字节的低4位 (3-0号位)包含每个MQTT控制报文类型特定的标志,必须与控制报文类型配套对应使用,否则服务端代理服务会拒绝服务或断开连接。具体的见下表(保留的标志必须按照表中的值设置):
报文类型 | 标志类型 | Bit3 | Bit2 | Bit1 | Bit0 |
CONNECT | 保留 | 0 | 0 | 0 | 0 |
CONNACK | 保留 | 0 | 0 | 0 | 0 |
PUBLISH | 使用 | 是否为重复发 | 服务质量高位 | 服务质量低位 | 是否保存消息 |
PUBACK | 保留 | 0 | 0 | 0 | 0 |
PUBREC | 保留 | 0 | 0 | 0 | 0 |
PUBREL | 保留 | 0 | 0 | 1 | 0 |
PUBCOMP | 保留 | 0 | 0 | 0 | 0 |
SUBSCRIBE | 保留 | 0 | 0 | 1 | 0 |
SUBACK | 保留 | 0 | 0 | 0 | 0 |
UNSUBSCRIBE | 保留 | 0 | 0 | 1 | 0 |
UNSUBACK | 保留 | 0 | 0 | 0 | 0 |
PINGREQ | 保留 | 0 | 0 | 0 | 0 |
PINGRESP | 保留 | 0 | 0 | 0 | 0 |
DISCONNECT | 保留 | 0 | 0 | 0 | 0 |
注:关于用“是否”描述的实际就是布尔类型,0表示否,1表示是;
1.3、第一字节各类型报文具体值:
固定报头报文类型高4位和标志位的低4位综合起来,最终第一个字节是有一个具体值的。为了更好的理解第一个字节的具体值是怎样得出来的,在下表列出了不同类型的报文及某个报文不同标志时的具体值:
报文类型 | 标志作用 | 二进制值 | 10进制值 | 16进制值 |
CONNECT | 连接服务端 | 00010000 | 16 | 0x10 |
CONNACK | 连接成功确认 | 00100000 | 32 | 0x20 |
PUBLISH | 新发布等级0不保存 | 00110000 | 48 | 0x30 |
PUBLISH | 新发布等级0需保存 | 00110001 | 49 | 0x31 |
PUBLISH | 新发布等级1不保存 | 00110010 | 50 | 0x32 |
PUBLISH | 新发布等级1需保存 | 00110011 | 51 | 0x33 |
PUBLISH | 新发布等级2不保存 | 00110100 | 52 | 0x34 |
PUBLISH | 新发布等级2需保存 | 00110001 | 53 | 0x35 |
PUBLISH | 重发等级2不保存 | 00111000 | 56 | 0x38 |
PUBLISH | 重发等级2需保存 | 00111001 | 57 | 0x39 |
PUBACK | 等级1发布成功 | 01000000 | 64 | 0x40 |
PUBREC | 等级2发布收到 | 01010000 | 80 | 0x50 |
PUBREL | 等级2发布释放 | 01100010 | 98 | 0x62 |
PUBCOMP | 等级2发布完成 | 01110000 | 112 | 0x70 |
SUBSCRIBE | 订阅主题 | 10000010 | 130 | 0x82 |
SUBACK | 订阅完成确认 | 10010000 | 144 | 0x90 |
UNSUBSCRIBE | 取消订阅 | 10100010 | 162 | 0xA2 |
UNSUBACK | 取消完成确认 | 10110000 | 176 | 0xB0 |
PINGREQ | 心跳包 | 11000000 | 192 | 0xC0 |
PINGRESP | 心跳回复 | 11010000 | 208 | 0xD0 |
DISCONNECT | 断开网络连接 | 11100000 | 224 | 0xE0 |
注:关于发布主题还有其他情况这里就没有全部列出,根据表中的规律就可以计算出实际的值了。
1.3、剩余长度(Remaining Length):
剩余长度是从第二个字节开始,最多允许占用四个字节。描述本次传送的应用消息在剩余长度字节之后(不包括剩余长度字节本身)还有多少个字节,包括可变报头(有的报文没有这部分) + 有效载荷(有的报文没有这部分)的所有字节数量。
根据上面描述,剩余长度属于变长的编码规则,也就是它可能是1-4个字节中的任何一种情况,那么怎样知道当前这个报文的剩余长度是占用了几个字节的呢?如果不能确定,那么接收方就无法正确解析数据了。所以MQTT协议规定剩余长度的每个字节的最高位(也就是7号位)作为是否还有下一个字节剩余长度的标志位,不做长度数值的表述位。这样每给剩余长度字节最大代表长度值就是127(二进制 1111111 的值)了,因为只有7个位表示长度了。向后每增加一个字节都代表前一个字节满值再加1的倍数,四个字节的剩余长度代表的长度值最大可为268435455。
如果剩余长度值不大于127,则只用一个字节表示,例如121,则剩余长度字节的二进制是01111001,含义见下表:
7号位 | 6-0号位 |
0 | 1111001 |
接下来没有剩余长度字节了 | 剩余长度是:121 |
如果剩余长度值大于127小于16384,则需用两个字节表示,例如15971,则剩余长度两字节具体值则是0xE3 0x7C(11100011 01111100),含义见下表:
1字节7号位 | 1字节6-0号位 | 2字节7号位 | 2字节6-0号位 |
1 | 1100011 | 0 | 1111100 |
后面还有字节描述长度 | 本子节描述长度:99 | 后面没有长度字节了 | 本字节描述长度:124 * 128 = 15872 |
两个字节代表的长度值相加 99 + 15872 = 15971,这既是完整的剩余长度值了。后面这个字节每增加1,则代表剩余长度值增加128。也就是前面字节的低7位值满都为1(127)再加1,就到后面字节加1,前面字节低7位归0。再加满再到后面字节加1,以此类推。所以两个字节可以表述的最大值是(11111111 01111111)127+(127*128) = 16383。
由于使用了两个字节表述剩余长度,那么前面的字节的最高位7号位就要置1,以告诉解析程序后面的字节还要按照剩余长度来计算。
如果剩余长度值大于16383小于2097152,则需用三个字节表示,例如2097150,则剩余长度三字节具体值则是0xFE 0xFF 0x7F(11111110 11111111 01111111),含义见下表:
1字节7号位 | 1字节6-0号位 | 2字节7号位 | 2字节6-0号位 | 3字节7号位 | 3字节6-0号位 |
1 | 1111110 | 1 | 1111111 | 0 | 1111111 |
还有长度字节 | 长度:126 | 还有长度字节 | 长度:127 * 128 = 16256 | 长度最后字节 | 长度:127 * 16384 = 2080768 |
三个字节代表的长度值相加 126 + 16256 + 2080768 = 2097150,这既是完整的剩余长度值了。3字节每增加1,则代表剩余长度值增加16384,即前两个字节满值再加1。四字节的原理也是这样向后推导,这里就不再列举了。
剩余长度使用1-4个字节可以描述的长度范围见下表:
字节数 | 最小值10/16进制 | 最小值2进制 | 最大值10/16进制 | 最大值2进制 | |
1 | 0(0x00) | 00000000 | 127(0x7F) | 01111111 | |
2 | 128(0x80,0x01) | 10000000 00000001 | 16383(0xFF,0x7F) | 11111111 01111111 | |
3 | 16384(0x80,0x80,0x01) | 10000000 10000000 00000001 | 2097151(0xFF,0xFF,0x7F) | 11111111 11111111 01111111 | |
4 | 2097152(0x80,0x80,0x80,0x01) | 10000000 10000000 10000000 00000001 | 268435455(0xFF,0xFF,0xFF,0x7F) | 11111111 11111111 11111111 01111111 |
2、可变报头(Variable header):
可变报头在固定报头与有效负载之间,不是所有的报文都有可变报头。报文类型不同可变报头的内容也不同。后面会对各报文的可变报头逐一讨论。某些类型的报文中的可变报头还包含报文标识符(Packet Identifier)字段。
2.1、报文标识符(Packet Identifier):
报文标识符,一定程度上相当于是每个报文的唯一ID,用于识别报文身份的。重复发送报文时,必须使用相同的报文标识符。在需要应答的控制报文里,标识符可以区分是应答的哪个报文。某些控制报文的可变报头部分包含一个两字节的报文标识符字段。这些报文分别是PUBLISH(QoS > 0时), PUBACK,PUBREC,PUBREL,PUBCOMP,SUBSCRIBE, SUBACK,UNSUBSCRIBE,UNSUBACK。
需要使用标识符的报文,发送方在每次发送一个新的报文时,必须分配一个没有使用过的报文标识符。报文标识符固定使用两个字节,按照双字节读值可用范围是0-65535(00000000 00000000 – 11111111 11111111)。
3、有效载荷(Payload):
在一些需要携带用户自定义的应用消息的MQTT控制报文中,会将这些信息放在报文的最后部分,称之为有效载荷。对于PUBLISH来说有效载荷就是应用消息。不同的控制报文有效载荷内容不同,后面会在分别介绍控制报文时具体讨论。下表列出哪些控制报文有包含有效载荷:
控制报文 | 有效载荷 |
CONNECT | 需要 |
CONNACK | 不 需要 |
PUBLISH | 可选,可以零长度 |
PUBACK | 不需要 |
PUBREC | 不需要 |
PUBREL | 不需要 |
PUBCOMP | 不需要 |
SUBSCRIBE | 需要 |
SUBACK | 需要 |
UNSUBSCRIBE | 需要 |
UNSUBACK | 不需要 |
PINGREQ | 不需要 |
PINGRESP | 不需要 |
DISCONNECT | 不需要 |
本节完,待续…