我们知道,使用 read 或 recvfrom 函数从 socket 上读取数据时,可能会导致阻塞。特别是 UDP 服务器,稍有不甚,数据报就丢失就会直接导致程序假死(阻塞在 recvfrom)。

还有 connect 函数,如果去连接一个网络上不存在的主机,需要等待很长时间,可能长达 2 分钟。如果我们能控制它在指定的时间内连接不上,就直接报错,行不行呢?

很可惜,上面的问题 linux 并未直接提供带超时的函数帮我们解决,所以我们需要一些奇技淫巧来完成上面的功能。

1. 如何设置超时?

常用的有 3 种方法来设置超时:

  • 1) 使用 alarm 函数,一旦到期就产生 SIGALRM 信号,打断正在执行的系统调用。
  • 2) 使用 select 函数。
  • 3) 使用套接字选项 SO_RCVTIMEO 和 SO_SNDTIMEO.

关于这几个方案,有几点要说明:

  • 三个技术都可用于输入和输出(read 和 write)
  • 对于阻塞的 connect 只能使用方案一,对于非阻塞的 connect,只能使用 select.
  • 方案三对 connect 不适用。
  • 方案一和二适用于任何描述符,而方案三仅适用于套接字描述符。

2. 使用 alarm 设置超时

它的伪代码如下,这里以 connect 为例:

void sighandler(int sig) {
// 信号处理函数,什么也不用做
return;
}

int connect_timeo(/*...*/, int nsec) {
// 注册信号
registSignal(SIGALRM, sighandler, &oldhandler);
// 开启一个 nsec 秒的 alarm
alarm(nsec);
ret = connect(/*...*/);
// 如果被信号打断,则表示超时
if (ret < 0 && errno == EINTR) {
errno = ETIMEDOUT;
}
// 删除 alarm
alarm(0);
registSignal(SIGALRM, oldhandler);
return

3. 实验代码

代码托管在 gitos 上,请使用下面的命令获取:

git clone https://git.oschina.net/ivan_allen/unp.git

如果你已经 clone 过这个代码了,请使用 ​​git pull​​​ 更新一下。本节程序所使用的程序路径是 ​​unp/program/advcio/conn_timeo/conn_timeo.cc​​​,另一个使用 alarm 为 recvfrom 设置超时的例子是 ​​unp/program/advcio/read_timeo/read_timeo_alarm​​.

4. 实验结果

ip 地址 192.168.166.4 在网络上并不存在,直接连接它就会导致 connect 函数阻塞,一直在发送 SYN 请求。

  • 不使用超时的 connect


66-套接字超时(alarm)_unp


图1 不使用超时的 connect


可以看到,默认的 connect 函数超时值约为 127 秒。

  • 使用超时的 connect

通过命令行 ​​--timeo​​ 选项传递超时值给 connec_timeo 函数。


66-套接字超时(alarm)_unp_02


图2 使用超时的 connect


5. 总结

  • 掌握使用 alarm 编写超时函数的方法

练习:使用 alarm 编写一个带超时的 recvfrom 函数(答案在read_timeo 文件下可以找到)。