在 linux 中对 io 操作就是把内核态准备就绪的数据拷贝到用户态。

啥是内核态呢,内核态就是 linux 内核,用户态则是用户进程中的某个线程,即 io 操作其实就是内核态和用户态的切换。

io 操作大致分为两种:

  1. 文件 io
  2. 网络 io

io 操作分为两步

  1. 发起 io 请求
  2. 接收处理 io

同步 io 和异步 io 最大的区别就是同步 io 的发起方(用户线程)会阻塞或轮询等待 io 完成,而异步则是在发起 io 请求后立即返回继续执行后面的代码。同步 io 的特点

1、同步 io 是用户线程发起 io 请求并以阻塞或轮询的方式来等待 io 的完成
2、同步 io 是 io 的发起方,同时也是处理方
3、同步 io 是需要将内核态准备就绪的数据拷贝到用户态,所以需要阻塞用户态程序并等待 io 完成

异步 io 的特点

1、异步 io 在用户线程发起 io 请求后会立即返回继续执行后续的逻辑流
2、异步 io 是 io 的发起方,但内核态才是处理方
3、异步 io 的处理方是内核态,所以不需要阻塞

阻塞 io:
用户线程发起 io 请求并阻塞用户线程释放 CPU 执行权,等待内核态的 io 处理完成。

非阻塞 io:
用户线程发起 io 请求会立即返回处理后面的代码,但是会有线程以轮询的方式查询内核态的 io 是否处理完成,如果 io 完成则立即拷贝到用户进程,这种方式对 CPU 资源消耗较高。

io 多路复用:
Java nio 就是多路复用的 io 模型,多路复用模型是由一个线程监听多个 socket,这种方案比较适用于 io 比较多的情况,io 多路复用的性能是比非阻塞 io 要高的,因为多路复用模型的轮询是在内核态,而非阻塞 io 的轮询是在用户态,但是在任务数量比较多或比较大的情况下 io 多路复用需要逐一去处理已完成的 io,会导致后续的 io 得不到处理或者等待过长时间才能得到处理。

信号驱动 io:
用户线程发起 io 请求,然后给负责 io 的 socket 注册一个函数用于完成后的回调,当内核态数据准备完成后会发出一个信号,用户线程接收后会调用之前注册的函数来读写 io

异步 io:
用户线程发起 io 请求后会立即返回,并当内核态的 io 完毕后会将数据拷贝到用户态,然后再发送信号通知用户线程已就绪,整个过程用户线程是不会阻塞也不需要其它额外操作的,除了发起 io 请求,处理 io 和拷贝数据均由内核态完成。

总结以上几种 io 模型,除了最后一个是异步 io 模型,其它的 io 模型都是同步。