接下来的内容是学习后续内容的基础,必须先讲清楚。为了方便你回忆 TCP 首部,这里再次把这个图贴出来,以便对照。
图1 TCP 首部
1. 序号
1.1 序号存在的意义
首先得弄清楚为什么要有序号。
在 APUE 基础中,我们通过 TCP 协议将数据发送给对方,就比如 helloworld
,这一串字节流,假设被拆分成了三个 TCP 报文段,第一个报文段携带了 hel
,第二个报文段携带了 lowo
,第三个报文段携带了 rld
,这三个报文段不一定是按照顺序送到对端的,那么对端收到这三个段是如何确定他们的顺序的呢?此时序号的意义就体现在这里。
1.2 序号
序号占用 4 字节,即 32 位。它的范围是 [0,232−1],也就是说一共有 4 294 967 296 个序号。TCP 协议中的序号,指的是报文段序号。
- 字节序号
TCP 连接中,为传送的字节流(数据)中的每一个字节按顺序编号。也就是说,在一次 TCP 连接建立的开始,到 TCP 连接的断开,你要传输的所有数据的每一个字节都要编号。这个序号称为字节序号。
- 初始序号 ISN
当新连接建立的时候,第一个字节数据的序号称为 ISN(Initial Sequence Number),即初始序号。ISN 一开始并不一定就是 1。在 RFC (规定网络协议的文档)中规定,ISN 的分配是根据时间来的。当操作系统初始化的时候,有一个全局变量假设为 g_number 被初始化为 1(或 0),然后每隔 4us 加 1. 当 g_number 达到最大值的时候又绕回到 0.当新连接建立时,就把 g_number 的值赋值给 ISN.
在 BSD 系统中,这段代码实现时并未遵守协议,它将 g_number 初始化为 1,每 8us 加 1,也就是说,每隔 1 秒增加 125000,约 9.5 小时后 g_number 又绕回到了 0.
初始序号是非常非常重要的概念,它告诉对端,第一个报文段是谁!而三次握手的目的,就是为了确认初始序号,这个在后面会讲。
- 报文段序号
如果一个 TCP 报文段的序号为 301,它携带了 100 字节的数据,就表示这 100 个字节的数据的字节序号范围是 [301, 400],该报文段携带的第一个字节序号是 301,最后一个字节序号是 400.
图2 前面实验抓取的一个数据包
在图 2 中,报文段序号是 2379453244,它携带了 6 字节的数据 hello\0
,这 6 字节的数据字节序号就是从 h->2379453244
,e->2379453245
一直到最后一个空字符 \0->2379453249
.
注意:序号字段只有在下面两种情况的任意一种才有意义:
- 数据字段至少包含一个字节
- 这是一个 SYN 段,或者是 FIN 段,或者是 RST 段。
2. 确认号
如果你还记得前面你和你对象发短信的例子的话,这里就不难了。每传送一个 TCP 段,都要等待对方回复一个确认。不过这种方式效率太低,在 TCP 协议中,一般采用累积确认的方式,即每传送多个连续 TCP 段,可以只对最后一个 TCP 段进行确认。
对方通过回复一个确认号,来表示确认已经接收到了哪个 TCP 段。比如发送方发送了一个报文段序号为 301 的 TCP 段,这个段携带了 100 字节数据,则接收方应当回复的确认号是 401,它表示接收方已经收到了字节序号为 [0, 400] 的数据,现在期望你发送字节序号为 401 以及以后的数据。
只有当 ACK 标志位被置位的时候,确认号这个字段才有效。
3. 一次完整的 TCP 连接到释放的过程
图3 这个数据包还是前面实验中抓取的
为了能够清晰的看到客户端与服务器的交互过程,这里将它画成了下面的时序图。
图4 客户端与服务器的交互
现在,我们只需要观察每一次发送 TCP 段后,对方是如何应答的。为了方便观察序号和确认号,我只保留了后三位。
4. 总结
- 字节序号与报文段序号
- 初始序列号
- 确认号