Nginx 是一个轻量级的HTTP 服务程序,相比其他服务器程序如Apache,Nginx占用内存少,稳定性高,并发处理能力强。同时Nginx 还是一个反向代理服务程序,和邮件代理服务程序。Nginx具有丰富的模块库、灵活的配置、较低资源消耗等优点。下面,我们一起深入看一下Nginx的工作机制

1. Nginx 如何实现高性能低消耗的呢?

我们从以下几个方面说明以下:

网络事件处理机制
  • Nginx 采用异步非阻塞的方式处理请求,可以同时处理上万的请求
  • Nginx 支持 select/epoll 等流行事件处理机制,根据系统环境自动选择
  • Nginx 采用独立于系统的事件处理机制,能够高效处理请求
资源分配技术
  • Nginx 采用分阶段资源分配技术,使得它的CPU和内存消耗非常低
多核处理优化
  • Nginx 默认采用多进程启动模式
  • Nginx 包含Master 进程 和 Worker 进程
  • 能够充分利用 SMP 对称多处理的优势,减少Worker进程磁盘I/O的阻塞
  • Nginx 支持Worker进程和CPU内核 一一对应绑定,避免进程上下文的切换致使cache失效
    基于上面提到技术,以及Nginx很多地方的优化,让Nginx成为最快的HTTP服务器。
2.Nginx的进程模型

在Nginx的技术架构中,进程模型是至关重要的一部分。接下来,我们一起看看Nginx进程模型,以及它们的工作机制。

Linux 系统中,Nginx默认以守护进程daemon方式启动,默认采用多进程方式。Nginx包括两种类型的进程:

  • Master 进程,数量只有一个,管理Nginx本身和Worker进程
  • Worker 进程,数量一般和CPU核数相等,Nginx的所有请求处理,均是在Worker进程中完成

下面,我们分别深入看一下Master和Worker进程。

nginx性能测算_后端

2.1 Master 进程工作机制

在Nginx启动时,Master进程创建,主要负责初始化Nginx和相关模块、fork Worker进程、接收处理外界信号等工作。

Nginx的初始化过程:

  • 解析配置文件,这是Nginx初始化最重要的一个环节
  • 调用各个配置指令回调函数,完成各个模块的配置、相互关联等
  • 建立listen 的 socket(listenfd)
  • 准备工作都完成后,fork worker子进程和cache子进程
    Master 进程信号处理机制
    我们通过kill命令发送信号给Nignx Master 进程,看看Master进程如何处理:

分析流程:

  • Master 进程接收到 HUP 信号
  • Master 进程重新加载配置文件
  • Master 进程启动新的Worker进程
  • Master 进程发送信号给Worker 进程
  • 老的Worker进程不再接收新的请求
  • 老的Worker进程处理完当前请求,退出
  • 至此,Nginx完成平滑重启

注意:Nginx 0.8 版本以后,提供了 -s参数,用于管理Nginx服务的停止和重启,注意line 11:

2.2 Worker 进程工作机制

Worker进程负责所有请求的处理工作,我们通过一个HTTP请求,来梳理一下Worker的工作流程:

  • 新的请求到来:所有的Work进程的listenfd都会变得可读
  • 竟抢互斥锁:所有 Worker 进程在注册listenfd读事件前,要先抢accept_mutex
  • 抢到互斥锁的Worker,注册listenfd读事件,在事件中调用accept接受该连接
  • 拿到请求后,Worker进程开始读取请求,解析请求,处理请求,产生数据,再返回给客户端
  • Worker进程断开连接

需要注意:一个HTTP请求,完全由Worker进程处理,而且只在一个Worker中处理

2.3 Master-Worker 进程架构机制的优势有哪些??

对于每个Worker 进程来说,独立的进程,不需要加锁,节约锁导致的资源开销;worker进程之间,互不干扰,平滑重启就是很好的例子,服务不中断。

2.4 网络事件处理机制

Nginx 采用的是异步非阻塞事件处理机制,支持select/poll/epoll/kqueue 等等。Nginx 同时会监控多个事件,调用他们是阻塞的。但是调用有超时时间,在超时时间内,如果有事件准备好了,就返回,否则重新放入epoll中。当读写返回EAGAIN时,事件将会被再次放入epoll中。

处理线程只有一个,同时处理的请求也只有一个,所谓多请求并发,只是在不断的切换请求而已。虽然是切换,但这种切换不涉及上下文切换,相比十分轻量。更多的并发,只是会占用更多的内存。

进程相关的还有,信号和定时器,这部分另外单独讲解。

3. Nginx 包含哪些模块

Nginx是模块化架构的服务,丰富的模块,松散耦合,也让Nginx更加强大!我看看Nginx 都有哪些模块

  • 内核模块
    实现了底层的通讯协议,为其他模块/进程构建运行环境、协作基础,打开listen 的端口,启动worker进程
  • HTTP/Mail模块
    两个特殊模块,位于内核模块和各功能模块间;在内核模块之上实现了另一层的抽象;处理HTTP/MAIL协议事件;确保调用功能模块顺序正确。
  • Event模块
    负责监听accept后建立的连接,对读写事件进行添加删除;与非阻塞 I/O 模型结合使用;支持select/poll/epoll/kqueue等;注意惊群效应,后面有解释。
  • Handler模块
    负责接受客户端请求并产生输出;通过配置文件中location指令配置 content handler 模块。
  • Filter模块
    负责输出内容处理,修改输出内容;Fiter模块在获取回复内容之后,向用户发送响应之前,执行处理动作;调用顺序在编译时就确定了。
  • Upstream模块
    实现反向代理的功能,负责将请求转发到后端服务器上,并读取响应,发回客户端;跨越单机的限制,完成网络数据的接收、处理和转发;
  • LoadBalancer模块
    根据配置指定算法,在众多的后端服务器中选择一个,完成请求的转发服务器;都有哪些算法呢?

惊群效应:

  • 当内核 accept 一个连接时,会唤醒所有等待中的进程
  • 但实际上只有一个进程能获取连接,其他的进程都是被无效唤醒的
  • 所以 Nginx 采用了自有的一套 accept 加锁机制,避免多个进程同时调用 accept
  • Nginx 多进程的锁在底层默认是通过 CPU 自旋锁来实现。如果操作系统不支持自旋锁,就采用文件锁。

 

 



多路复用-select、epoll

select

I/O多路复用采用的是select 模型,即系统发出select系统调用,等待内核主动将可
用的文件描述符信息发送给应用一端,fd未准备好,应用会block住socket请
求,当fd就许后,select 会遍历维护的文件描述符发现可用的文件描述符。

epoll

每当fd就绪,系统采用回调函数将fd放入就绪列表,效率非常高。
举例:
告诉服务员,用餐结束,服务员告知老板,说有几桌要结账,老板需要询问
告诉服务员,用餐结束,服务员告知老板,说哪号桌要结账,老板不需要询问。
select epoll 优缺点总结

模型

优点

缺点

select

 

1.采用线性遍历的方式获取可用的fd文件描述符

2.可维护文件描述符大小有限制为1024

epoll

1.每当fd就绪,系统采用回调函数将fd放入就绪列表,效率非常高。

2.最大连接数没有限制