相信不少人在求职时,都看过这样的要求:

  • 精通 TCP/IP,熟练使用 Socket 进行网路编程

面试中也会经常被问到:TCP/IP 协议是什么、三次握手四次挥手等问题。可以参考视频面试官:TCP/IP 协议到底在讲什么?TCP 为什么是三次握手,而不是两次或四次?TCP拥塞控制的问题?TCP 协议下 socket 有可能丢包吗?

为什么它这么重要?TCP/IP 协议是互联网的基石,作者鲍勃・卡恩和文顿・格雷被并成为 “互联网之父”,30 多年过去了,它仍然是全球互联网得以稳定运行的保证。

不管你是做开发、运维还是信息安全的,TCP/IP 协议都是你绕不过去的一环,程序员需要像学会看书写字一样,学会这个技能。

今天我们就详细讲解下 TCP/IP 的各个协议。

知识点

  • IP 地址
  • 域名
  • MAC 地址
  • 端口号
  • 封装和分用

实验简介

上世纪 70 年代,随着计算机技术的发展,计算机使用者意识到:要想发挥计算机更大的作用,就要将世界各地的计算机连接起来。但是简单的连接是远远不够的,因为计算机之间无法沟通。因此设计一种通用的 “语言” 来交流是必不可少的,这时 TCP/IP 协议就应运而生了。

TCP/IP(Transmission Control Protocol/Internet Protocol)是传输控制协议和网络协议的简称,它定义了电子设备如何连入因特网,以及数据如何在它们之间传输的标准。

TCP/IP 不是一个协议,而是一个协议族的统称,里面包括了 IP 协议、ICMP 协议、TCP 协议、以及 http、ftp、pop3 协议等。网络中的计算机都采用这套协议族进行互联。

下面我们将会学习预备知识。

IP 地址

网络上每一个节点都必须有一个独立的 IP 地址,通常使用的 IP 地址是一个 32bit 的数字,被 . 分成 4 组,例如,255.255.255.255 就是一个 IP 地址。有了 IP 地址,用户的计算机就可以发现并连接互联网中的另外一台计算机。

在 终端输入 ifconfig -a 命令查看自己的 IP 地址:

ifconfig -a

java tcp 大量的time wait_java

域名

用 12 位数字组成的 IP 地址很难记忆,在实际应用时,用户一般不需要记住 IP 地址,互联网给每个 IP 地址起了一个别名,习惯上称作域名。

域名与计算机的 IP 地址相对应,并把这种对应关系存储在域名服务系统 DNS (Domain Name System) 中,这样用户只需记住域名就可以与指定的计算机进行通信了。

常见的域名包括 com、net 和 org 三种顶级域名后缀,除此之外每个国家还有自己国家专属的域名后缀(比如我国的域名后缀为 cn)。目前经常使用的域名诸如百度(http://www.baidu.com)、Linux 组织(http://www.lwn.net)等等。

我们可以使用命令 nslookup 或者 ping 来查看与域名相对应的 IP 地址,由于实验楼网络限制,我们可以使用 ping github.com(如果 github 也 ping 不通,那么可以使用 ping labfile.oss.aliyuncs.com,如果你是会员账户,那么也可以 ping 其他的域名)查看。

例如:

java tcp 大量的time wait_python_02

关于域名与 IP 地址的映射关系,以及 IP 地址的路由和发现机制,将在后续章节进行详细的说明。

MAC 地址

MAC(Media Access Control)地址,或称为物理地址、硬件地址,用来定义互联网中设备的位置。

在 TCP/IP 层次模型中,网络层管理 IP 地址,链路层则负责 MAC 地址。因此每个网络位置会有一个专属于它的 IP 地址,而每个主机会有一个专属于它 MAC 地址。

端口号

IP 地址是用来发现和查找网络中的地址,但是不同程序如何互相通信呢?这就需要端口号来识别了。如果把 IP 地址比作一间房子,端口就是出入这间房子的门。真正的房子只有几个门,但是端口采用 16 比特的端口号标识,一个 IP 地址的端口可以有 65536(即:216)个之多!

服务器的默认程序一般都是通过人们所熟知的端口号来识别的。例如,对于每个 TCP/IP 实现来说,SMTP(简单邮件传输协议)服务器的 TCP 端口号都是 25,FTP(文件传输协议)服务器的 TCP 端口号都是 21,TFTP(简单文件传输协议)服务器的 UDP 端口号都是 69。任何 TCP/IP 实现所提供的服务都用众所周知的 1-1023 之间的端口号。这些人们所熟知的端口号由 Internet 端口号分配机构(Internet Assigned Numbers Authority,IANA)来管理。

常用协议对应端口号:

  • SSH 22
  • FTP 20 和 21
  • Telnet 23
  • SMTP 25
  • TFTP 69
  • HTTP 80
  • SNMP 161
  • Ping 使用 ICMP,无具体端口号

封装和分用

封装:当应用程序发送数据的时候,数据在协议层次当中自顶向下通过每一层,每一层都会对数据增加一些首部或尾部信息,这样的信息称之为协议数据单元(Protocol Data Unit,缩写为 PDU),在分层协议系统里,在指定的协议层上传送的数据单元,包含了该层的协议控制信息和用户信息。如下图所示:

  • 物理层(一层)PDU 指数据位(Bit)
  • 数据链路层(二层)PDU 指数据帧(Frame)
  • 网络层(三层)PDU 指数据包(Packet)
  • 传输层(四层)PDU 指数据段(Segment)
  • 第五层以上为数据(data)

java tcp 大量的time wait_编程语言_03

分用:当主机收到一个数据帧时,数据就从协议层底向上升,通过每一层时,检查并去掉对应层次的报文首部或尾部,与封装过程正好相反。

RFC

RFC(Request for Comment)文档是所有以太网协议的正式标准,并在其官网上面公布,由 IETF 标准协会制定。大量的 RFC 并不是正式的标准,出版的目的只是为了提供信息。RFC 的篇幅不一,从几页到几百页不等。每一种协议都用一个数字来标识,如 RFC 3720 是 iSCSI 协议的标准,数字越大意味着 RFC 的内容越新或者是对应的协议(标准)出现的比较晚。

所有的 RFC 文档都可以从网络上找到,其官网为 IETF。在网站上面可以通过分类以及搜索快速找到目标协议的 RFC 文档。目前在 IETF 网站上面的 RFC 文档有数千个,但是我们不需要全部掌握,在工作或学习中如果遇到可以找到对应的解释,理论与实际结合会有更好地效果,单纯阅读 RFC 的效果一般。

作业

  1. 查看自己电脑的 IP 地址,并截图。
  2. ping github.com,查看 IP 地址,并截图。

第一节的学习到此结束,欢迎来实验楼免费学习该课程,解锁后续知识点:

  • 网络的预备知识:IP 地址、域名、RFC 文档等
  • 链路层、以太网的特点,常用协议:PPP 协议、SLIP 协议
  • IP 网际协议的介绍:地址分类、子网划分、路由选择、NAT、IPv6
  • 网络层其他协议:ARP、RARP、ICMP、IGMP,ping 和 traceroute 命令的使用
  • TCP 连接建立、重传等机制
  • UDP 连接建立、差错控制等机制
  • 网络层常用的协议:DNS 协议、FTP 协议、HTTP 协议等