一般来说,高并发的解决方案就是提供多线程模型,服务器为每个客户端请求分配一个线程,使用同步 I/O,系统通过线程切换来弥补同步 I/O
调用的时间开销。比如 Apache 就是这种策略,由于 I/O
一般都是耗时操作,因此这种策略很难实现高性能,但非常简单,可以实现复杂的交互逻辑。而事实上,大多数网站的服务器端都不会做太多的计算,它们接收到请求以后,把请求交给其它服务来处理(比如读取数据库),然后等着结果返回,最后再把结果发给客户端。因此,Node.js
针对这一事实采用了单线程模型来处理,它不会为每个接入请求分配一个线程,而是用一个主线程处理所有的请求,然后对 I/O
操作进行异步处理,避开了创建、销毁线程以及在线程间切换所需的开销和复杂性。
什么是同步机制?
同步就是必须等待上一个函数执行完毕,才能继续向下执行
什么是异步机制?
主线程执行到类IO操作时,会调用底层封装的libuv分配线程执行,并放入队列中等待主线程循环事件抽取,详细的后面会讲到
什么是阻塞机制?
顾名思义,必须等待前一个得到结果后才能继续执行,和同步容易混淆,但阻塞主要针对的是IO操作
什么是非阻塞机制?
非阻塞,意味着不用等待前一个IO操作返回就可以直接执行其他的IO操作
想必大家已经对这些概念有了一定了解,就让我们继续向下阅读
众所周知,JavaScript是单线程执行的,也就是说所有的非IO请求代码都会在主线程中同步执行,但是当我们发起IO请求时,该IO请求就不是在主线程中执行了,不然主线程就会被阻塞调,无法响应其他事件,看下图
:
NodeJs是异步IO调用,根据上图我们所得,当我们发起IO请求时,调用的是各个不同平台的操作系统内部实现的线程池内的线程,这里的IO请求不仅仅是读写文件,在unix中,将计算机抽象了一层,磁盘文件,硬件,套接字等几乎所有计算机资源都被抽象为文件,即IO请求就是抽象后的文件
。
NodeJs基于libuv的架构示意图:
什么是libuv?
Libuv是一个高性能的,事件驱动的异步I/O库,它本身是由C语言编写的,具有很高的可移植性。libuv封装了不同平台底层对于异步IO模型的实现,所以它还本身具备着Windows, Linux都可使用的跨平台能力。
什么是IOCP?
是windows支持多个同时发生的异步I/O操作的应用程序编程接口
根据上图所得,Node是基于libuv封装层运行来实现跨平台兼容的,所有平台兼容性的判断都由这一层来完成,并保证Node程序与unix和IOCP之间各自独立,Node在编译期间会判断平台条件,选择性编译unix目录或windows目录下的原文件到目录程序中。
具体异步IO实现图:
仔细查看上图我们发现:
构成NodeJs异步IO模型主要分四大要素
- 事件循环
- 观察者
- 请求对象
- IO线程池
主线程操作:
发起异步IO调用,将请求参数(param, path, callback)等信息封装到请求对象上,然后将请求对象放入请求队列中,等待线程池给该请求分配可用线程
线程池操作:
如果线程池中有可用的线程,则取出请求队列内请求对象并分配线程,在分配的线程内执行对象中的IO操作,执行完成后将执行结果封装到请求对象中,通知线程池IO操作已经完成,然后将该线程还给线程池
事件循环操作:
底层使用了while(true)机制获取已完成IO操作的事件,并触发该事件,相对应的IO事件观察者会获取该请求对象(此时该请求对象已经涵盖了callback, param等),IO观察者取出callback和IO执行结果并调用执行函数callback
总结
Node.js 在主线程里维护了一个事件队列,当接到请求后,就将该请求作为一个事件放入这个队列中,然后继续接收其他请求。当主线程空闲时(没有请求接入时),就开始循环事件队列,检查队列中是否有要处理的事件,这时要分两种情况:如果是非 I/O 任务,就通过主线程处理,并通过回调函数返回到上层调用;如果是 I/O 任务,就从 线程池 中拿出一个线程来处理这个事件,并通过观察者指定回调函数,然后继续循环队列中的其他事件。
当线程中的 I/O 任务完成以后,通过观察者执行指定的回调函数,并把这个完成的事件放到事件队列的尾部,等待事件循环,当主线程再次循环到该事件时,就直接处理并返回给上层调用