I/O模型:
- 阻塞型I/O
- 非阻塞型I/O
- 信号驱动式I/O
- 异步I/O
- I/O复用
阻塞型I/O
默认情况下,所有套接字都是阻塞的。
非阻塞型I/O
进程把一个套接字设置成非阻塞是在通知内核:当所请求的I/O操作非的把本进程置于休眠状态时才能完成,不要把本进程置于休眠状态,而是返回一个错误(后面会进行讲解)
I/O复用
调用select或poll,阻塞在这两个系统调用中的某一个之上,而不是阻塞在真正的I/O系统调用上
传统的多线程模式下也可以进行操作,但是多线程是以CPU为基础的,要进行线程切换,因此在单线程模式下找一种办法来处理(当客户A发送消息时,客户B发送的消息会被放在AMD,不会丢失)
select函数
该函数允许进程指示内核等待多个事件中的任何一个发生,并只有在有一个或多个事件发生或经历一段指定的时间后才唤醒他
#include <sys/time.h>
#include <sys/types.h>
#include <unistd.h>
int select(int nfds, fd_set *readfds, fd_set *writefds,fd_set *exceptfds, struct timeval *timeout);
void FD_CLR(int fd, fd_set *set);
int FD_ISSET(int fd, fd_set *set);
void FD_SET(int fd, fd_set *set);
void FD_ZERO(fd_set *set);
参数分析
- nfds:最大文件描述符
在设计之初,内核就自定义了1024个描述符(可见后面的select的最大描述符数),可以用FD_SETSIZE标识,在程序运行的时候,每一个文件描述符都有随机的编号,nfds就是最大的一个 - struct timeval *timeout:告知内核等待所指定描述符中的任何一个就绪可花多长时间,其timeval结构用于指定这段时间的秒数和微秒数
struct timeval { long tv_sec; /* seconds */ long tv_usec; /* microseconds */ }; /* * 永远等待下去:参数为空 * 等待一段固定时间 * 根本不等待:检查描述符后立即返回,轮询,为此应该返回一个timeval结构 */
- 读/写/异常集—fd_set *:当客户端要对服务端进行信息传递时,让内核测试读,写和异常条件的描述符。select函数修改由指针readset,writeset,exceptset所指向的描述符集,因而这三个参数都是值-结果参数,调用该函数时,我们知道所有关心的描述符的值,该函数返回时,结果将知识哪些描述符已就绪。该函数返回后,我们使用FD_ISSET宏类测试fd_set数据类型中的描述符。描述符集内任何与未就绪描述符对应的位返回时均清成0。为此,每次重新调用select函数时,我们都得在此把所有描述符集内所关心的位均置为1
/* void FD_CLR(int fd, fd_set *set); int FD_ISSET(int fd, fd_set *set); void FD_SET(int fd, fd_set *set); void FD_ZERO(fd_set *set); */ for (int i = 0; i < n; i++) { fds[i] = accept(...); // 把所有客户的文件描述符放入一个数组先 if (fds[i] > max) { max = fds[i]; // 求出最大文件描述符 } } while (1) { FD_ZERO(&rset); for (int i = 0; i < n; i++) { FD_SET(fds[i], &rset); // 让内核查看是否可读,可读在rset中文件描述符为1 } }
描述符就绪条件
select的最大描述符数
在早些时候,大多数应用程序不会用到那么许多描述符。当初设计select时,操作系统通常对每个进程可用的描述符数设置了上限,select就使用相同的上限值。然而当今的unix版本允许每个进程使用事实上无限数目的描述符(仅仅受限于内存总量和管理性限制)
选择BDS/OS已改变了内核实现以允许更大的描述符集,并定义了四个新的FD_XXX宏用于定义动态分配并操纵这样的描述符集。然而从移植性来看,使用大描述符需要小心。
str_cli函数
此版本在于当套接字上发生某些事情的时候,客户可能阻塞于fgets调用,新版本改为阻塞于select,或是等待标准输入可读,或是等待套接字可读。
- 如果对端TCP发送数据,那么该套接字变成可读,并且read返回一个大于0的值
- 如果对端TCP发送一个FIN(对端终止进程),那么该套接字变成可读,并且read返回
- 如果对端TCP发送一个RST(对端主机崩溃后重新启动),那么该套接字变为可读,并且read返回-1,而error中含有确切的错误码
#define MAXLINE 100
void str_cli(FILE* fp, int sockfd) {
int maxfdp1;
fd_set rset;
char sendline[MAXLINE], recvline[MAXLINE];
FD_ZERO(&rset);
for(;;) {
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
select(maxfdp1, &rset, NULL, NULL, NULL);
if (FD_ISSET(sockfd, &rset)) {
if (read(sockfd, recvline, MAXLINE) == 0) {
perror("read failed");
}
fputs(recvline, stout);
}
if (FD_ISSET(fileno(fp), &rset)) {
if (fgets(sendline, MAXLINE, fp) == NULL) {
return;
}
write(sockfd, sendline, strlen(sendline));
}
}
}
但是有时候不能忽略一个问题!RTT:round-trip time往返时间,加上服务器的处理时间,这是最理想的状态。可是在数据传输的时候。
可是这个是单进程,传输是进行管道传输的,是一个通道!可是在函数中当写完这个请求后,连接就立即关闭了???可是管道里面还要其他的请求和应答,而main函数随后终止。因此,在批量方式下,标准输入中的EOF并不意味着我们同时也完成了从套接字的读入,可能仍然有请求在去往服务器的路上,或者仍有应答在返回客户的路上。
这个时候便要用到半关闭(shutdown):也就是说,我们想给服务器发送一个FIN,告诉他我们已经完成了数据传送,但是仍然保持着套接字描述符打开以便读取。
来看看shutdown半关闭
close函数有两个限制,都可用shutdown来解决
- close把描述符的引用计数减1,仅在该计数变为0时才关闭套接字,使用shutdown可以不管引用计数就激发TCP的正常连接序列
- close终止代码读和写两个分析的数据传送,既然TCP是全双工的,有时候我们需要告知对端我们已经完成了数据发送,即使对端仍有数据要发送给我们。这就是典型的str_cli函数在批量输入发送时候的情况
#include <sys/socket.h>
int shutdown(int sockfd, int howto);
// shutdown主要依赖于howto的参数
// SHUT_RD:关闭连接的这一半,套接字中不再有数据可用接收
// SHUT_WR:关闭连接的写这一半,套接字中不再有数据可用写
// SHUT_RDWR:连接的读半部和写半部都关闭,这和调用两次shutdown等效,第一次调用SHUT_RD,第二次调用SHUT_WR
下面来看看完整的str_cli代码
#define MAXLINE 100
void str_cli(FILE* fp, int sockfd) {
// 初始化sedineof为0,只要该标志为0,每次在主循环中我们总是select标志输入的可读性
int maxfdp1, stdineof;
fd_set rset;
char buf[MAXSIZE];
int n;
stdineof = 0;
FD_ZERO(&rset);
for(;;) {
if (stdineof== 0)
FD_SET(fileno(fp), &rset);
FD_SET(sockfd, &rset);
maxfdp1 = max(fileno(fp), sockfd) + 1;
select(maxfdp1, &rset, NULL, NULL, NULL);
if (FD_ISSET(sockfd, &rset)) {
if (read(sockfd, recvline, MAXLINE) == 0) {
if (stdineof == 1) return;
else perror("failed");
}
write(fileno(stdout), buf, n);
}
if (FD_ISSET(fileno(fp), &rset)) {
// 当我们在标准输入上碰到EOF时,我们把新标志stdineof设置为1,并且把第二个参数改成SHUT_WR,read和write对缓冲区进行操作而不是文本
if (read(fileno(fp), recvline, MAXLINE) == 0) {
stdineof = 1;
shutdown(sockfd, SHUT_WR); // send FIN
FD_CLR(fileno(fp), &rset);
continue;
}
write(sockfd, buf, n);
}
}
}
接下来服务端代码(注释已经详尽)
#include <iostream>
#include <sys/socket.h>
#include <sys/types.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <stdio.h>
#include <string.h>
#include <sys/time.h>
#define SERVER_PORT 3670
#define SERVER_IP "127.0.0.1"
int main(void) {
int sockfd, confd;
int client[FD_SETSIZE]; // 1024
char buf[BUFSIZ]; // default
fd_set rset, allset;
struct sockaddr_in server_addr, client_addr;
int i, j, maxi, maxfd, neardy, n;
socklen_t client_addrlen;
sockfd = socket(AF_INET, SOCK_STREAM, 0);
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(SERVER_PORT);
server_addr.sin_addr.s_addr = inet_addr(SERVER_IP);
bind(sockfd, (struct sockaddr*)&server_addr, sizeof(server_addr));
listen(sockfd, 4);
// 此时监听描述符为最大文件描述符
maxfd = sockfd;
// 设置一个数组,全部初始化为-1,当有已连接描述符时把描述符按顺序加入
maxi = -1;
for (i = 0; i < FD_SETSIZE; i++) {
client[i] = -1;
}
FD_ZERO(&allset);
// 利用select的唯一监听描述符这一前提初始化我们的数据结构
FD_SET(sockfd, &allset);
while(1) {
// 获得上一步的io文件描述符
rset = allset;
// 等待一个连接
neardy = select(maxfd+1, &rset, NULL, NULL, NULL);
// 连接失败
if (neardy < 0) {
perror("select error");
}
// 查看监听描述符是否在可读文件描述符中,即查看是否有新的客户连接
if (FD_ISSET(sockfd, &rset)) {
client_addrlen = sizeof(client_addr);
// 和客户端连接并获得套接字
confd = accept(sockfd, (struct sockaddr*)&client_addr, &client_addrlen);
printf("received from %s at PORT %d\n", inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
// 当有已连接描述符时把描述符按顺序加入,按顺序!
for (i = 0; i < FD_SETSIZE; i++) {
if (client[i] < 0) {
client[i] = confd;
break;
}
}
// FD_SETSIZE只有1024个,当超过最大限制,会报错
if (i == FD_SETSIZE) {
fputs("too many clients\n", stderr);
exit(1);
}
// 同时把该已连接描述符加入到集合中
FD_SET(confd, &allset);
// 判断最大文件描述符
if (confd > maxfd) {
maxfd = confd;
}
// 判断最大文件描述符在client中的位置
if (i > maxi) {
maxi = i;
}
// 没有多余的可读的描述符
if (--neardy == 0) {
continue;
}
}
// 遍历maxi检查所有的客户端的数据,所有的io都由这个进行!!!
for (i = 0; i < maxi; i++) {
if (client[i] < 0) {
continue;
}
// 查看该描述符是否在rset中
if (FD_ISSET(client[i], &rset)) {
// 如果连接关闭了
if (n = read(client[i], buf, sizeof(buf)) == 0) {
close(client[i]);
FD_CLR(client[i], &allset);
client[i] = -1;
}
else if (n > 0) {
bzero(buf, BUFSIZ);
for (j = 0; j < n; j++) {
buf[j] = toupper(buf[j]);
}
sleep(10);
write(client[i], buf, n);
}
}
else if (--neardy == 0) {
break;
}
}
}
close(sockfd);
return 0;
}
pselect函数
pselect是由于POSIX发明的,如今有很多unix变种支持他,我们仅做了解
#include <sys/select.h>
int pselect(int nfds, fd_set *readfds, fd_set *writefds,fd_set *exceptfds, const struct timespec *timeout,const sigset_t *sigmask);
相对于select改变的地方
- pselect使用timespec结构,而不是timeval结构
struct timespec { long tv_sec; /* seconds */ long tv_nsec; /* nanoseconds,支持纳秒,老结构支持微秒 */ };
- pselect函数增加了第六参数,一个指向信号掩码的指针,该参数允许程序先禁止递交某种信号,再测试由这些当前被禁止信号的信号处理函数设置的全局变量,然后调用pselect,告诉他重新设置信号掩码
poll函数
#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
参数分析:
- struct pollfd *fds:指向一个结构狐族第一个元素的指针,每个数组元素都是一个plllfd结构
struct pollfd { int fd; /* file descriptor */ short events; /* 发送的事件 */ short revents; /* 返回的事件 */ };
- nfds_t nfds:结构体数组的元素个数
- timeout:时间限制
poll相对于select的优缺点:
-
文件描述符可以自定义的修改,比如1024修改成5000
// 查看 cat /proc/sys/fs/file-max // 如果有需要,修改配置 sudo vi /etc/security/limits.conf // 在文件尾写入以下配置,soft软限制,hard硬限制 * soft nofile 65536 * hard nofile 100000
-
select的监听,返回集合是一个集合,poll把题目分开了
-
自定义的文件描述符数组,搜索范围减小了
服务器代码
#include <sys/socket.h>
#include <sys/types.h>
#include <arpa/inet.h>
#include <iostream>
#include <string.h>
#include <poll.h>
#include <unistd.h>
#define OPEN_MAX 1024
#define SER_PORT 3000
#define SER_IP "127.0.0.1"
int main(void) {
int i, maxi, listenfd, connfd, sockfd;
int neardy;
ssize_t n;
char buf[BUFSIZ];
socklen_t clilen;
struct pollfd client[OPEN_MAX];
struct sockaddr_in cliaddr, servaddr;
listenfd = socket(AF_INET, SOCK_STREAM, 0);
bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_port = htons(SER_PORT);
servaddr.sin_addr.s_addr = inet_addr(SER_IP);
bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr));
listen(listenfd, 128);
client[0].fd = listenfd;
client[0].events = POLLIN;
for (i=1; i < OPEN_MAX; i++) {
client[i].fd = -1;
}
maxi = 0;
for(;;) {
neardy = poll(client, maxi+1, -1);
if (client[0].revents & POLLIN) {
clilen = sizeof(cliaddr);
connfd = accept(listenfd, (struct sockaddr*)&cliaddr, &clilen);
for (i = 1; i < OPEN_MAX; i++) {
if (client[i].fd < 0) {
client[i].fd = connfd;
break;
}
}
if (i == OPEN_MAX) {
perror("faile");
}
client[i].events = connfd;
if (i > maxi) {
maxi = i;
}
if (--neardy == 0) {
continue;
}
}
for (i = 1; i < maxi; i++) {
if (sockfd = client[i].fd < 0) {
continue;
}
if (client[i].revents & POLLIN) {
if (n = read(client[i].fd, buf, BUFSIZ) < 0) {
if (errno == ECONNRESET) {
close(sockfd);
client[i].fd = -1;
}
else {
perror("fail");
}
}
else if (n == 0) {
close(sockfd);
client[i].fd = -1;
}
else {
write(sockfd, buf, n);
}
if (--neardy == 0) {
break;
}
}
}
}
return 0;
}