Nginx笔记详解

一.Nginx概述

1.Nginx是什么?

Nginx是一个高性能的HTTP和反向代理服务器,特点的占用内存比较少,并发能力强.但是不支持Java语言,java程序只能通过与tomcat配合完成.Nginx专门为性能优化而开发,性能是最重要的考量.

2.Nginx的作用?

基础功能有,负载均衡,反向代理,动静分离.

动静分离:为了加快网站的解析速度,可以把动态页面和静态页面由不同的服务器来解析,加快解析速度,降低原来单个服务器的压力.

3.Nginx默认端口80

nginx监听端口为9000

二.Nginx的使用

1.常用命令

启动命令: 在nginx/sbin目录下执行 ./nginx

关闭命令: 在nginx/sbin目录下执行 ./nginx -s stop

重新加载命令: 在nginx/sbin目录下执行 ./nginx -s reload

查看版本: 在nginx/sbin目录下执行 ./nginx -v

查看进程: ps -ef|grep nginx

2.重要的配置文件

Nginx默认配置文件都放在nginx/conf/下 , 主配置文件为 nginx.conf, 后续nginx的使用基本上都是在此配置文件上进行相应的修改.

3.nginx.conf配置文件详解

文件大致可以分为三个部分: 全局块 , events块 , http块.

3.1全局块

从配置文件开始到events块之间的内容 , 主要会设置一些影响服务器整体运行的配置指定. 主要包括配置云行Nginx服务器的用户(组) , 允许生成worker_process数 , 进程PID存放路径 , 日志存放路径和类型以及配置文件的引入.

worker_processes  1;
#这给Nginx服务器并发处理服务的关键配置 , worker_processes值越大 , 可以支持的并发处理量也越多 , 但是会受到硬件 , 软件的设备的制约.

设置默认是 1 .调大 : 一般设置的是CPU和核心数量相等

3.2 events块

events块涉及的指令主要影响Nginx服务器与用户的网络连接,常用的设置包括是否开启对多worker_processes下的网络连接进行序列化 , 是否允许同时接收多个网络连接 , 选取那种时间驱动模型来处理连接请求 , 每给worker_processes可以同时支持的最大连接数等.

每台nginx 服务器的最大连接为:worker_processes*worker_connections

events{
	worker_connections 1024;
}
#该设置表示每个worker_processes支持的最大连接数为1024 , 这部分的配置对Nginx的性能影响较大,在实际中应灵活配置

该设置表示单个进程可以允许建立外部连接的数量,数字越大,能同时处理的连接数越多. 最大限制是65535

3.3 Http块

这是Nginx中服务配置最频繁的部分,代理 , 缓存 和日志定义等.需要注意的是": http块也可以包括http全局快 , server块

1.http全局块

http全局快配置的指令包括文件引入 , MIME-TYPE 定义 , 日志自定义、连接超时时间、单链接请求数上限等。

2.server块

这块和虚拟主机有密切关系,虚拟主机从用户角度看,和一台独立的硬件主机是完全一样的,该技术的产生是为了节省互联网服务器硬件成本。

  每个 http 块可以包括多个 server 块,而每个 server 块就相当于一个虚拟主机。

而每个server 块也分为全局 server 块,以及可以同时包含多个 locaton 块。

1.全局server块

最常见的配置是本虚拟机主机的监听配置和本虚拟主机的名称或IP配置.

2.location块

一个server块可以配置多个location块.这块的主要作用是基于Nginx服务器收到的请求字符串.

3.4 server块中的location配置

该指令配置用于匹配URL

语法如下

location [= | ~ | ~* |^~ ] uri {
    
}
#[]中为可选项
  1. = :用于不含正则表达式的uri前 , 要求请求字符串与uri严格匹配, 如果匹配成功 , 就停止继续向下搜索并立即处理该请求.
  2. ~ : 用于表示uri 包含 正则表达式 , 并且区分大小写.
  3. ~* : 用于表示uri 包含 正则表达式 ,并且不区分大小写
  4. ^~ : 用于 不含 正则表达式的uri前 , 要求nginx服务器找到标识uri和请求字符串匹配最高的location后,立即使用此location处理请求,而不再使用location块中正则uri请求字符串做匹配.
  5. 注意:如果 uri 包含正则表达式,则必须要有 ~ 或者 ~* 标识。

三.Nginx负载均衡配置

upstream称为上游服务器,即真实处理请求的业务服务器

1. 轮询(默认)

每给请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除.

2.weight代表权重,

默认为1 , 权重越高被分配的客户端越多.指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况.

upstream server_pool{   
    server 192.168.10.1 weight=1;    
    server 192.168.10.2 weight=2; 
    server 192.168.10.3 weight=3;   
}

3.ip_hash

每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题

upstream server_pool{   
    ip_hash;    
    server 192.168.10.1:80;   
    server 192.168.10.2:80;  
    server 192.168.10.3:80;  
}

4.fair

按后端服务器的响应时间来分配请求,响应时间短的优先分配。

upstream server_pool{   
    server 192.168.10.1:80;    
    server 192.168.10.2:80;
    server 192.168.10.3:80;
    fair;   
}

四.Nginx优化

需要设置多少个worker

Nginx 同redis类似都采用了IO多路复用机制,每个worker都是一个独立的进程,但每个进程里只有一个主线程,通过异步非阻塞的方式来处理请求, 即使是千上万个请求也不在话下。每个worker的线程可以把一个cpu的性能发挥到极致。所以worker数和服务器的cpu数相等是最为适宜的。设少了会浪费cpu,设多了会造成cpu频繁切换上下文带来的损耗。

连接数

worker_connections 1024

这个值是表示每个worker进程所能建立连接的最大值,所以,一个nginx能建立的最大连接数,应该是worker_connections * worker_processes。

当然,这里说的是最大连接数,对于HTTP请求本地资源来说,能够支持的最大并发数量是worker_connections * worker_processes,

Ÿ 如果是支持http1.1的浏览器每次访问要占两个连接,所以普通的静态访问最大并发数是: worker_connections * worker_processes /2,

Ÿ 而如果是HTTP作为反向代理来说,最大并发数量应该是worker_connections * worker_processes/4。

因为作为反向代理服务器,每个并发会建立与客户端的连接和与后端服务的连接,会占用两个连接。

面试题:
第一个:发送请求,占用了woker的几个连接数?
答:2个或者4个 , 在nginx动静分离时,
静态资源存放在nginx服务器上.访问静态资源时只需要两个,客户端 ->请求-> worker , 另一个是worker ->响应-> 客户端的; 
访问动态资源需要四个,一个是客户端 ->请求-> worker , worker ->请求-> tomcat , tomcat ->响应-> worker , worker ->响应-> 客户端.
    
第二个:nginx有一个master,有四个woker,每个woker支持最大的连接数1024,支持的最大并发数是多少?

如果是普通的静态访问最大并发数是:worker_connection * worker_processes / 2 ,

如果是HTTP作为反向代理来说,最大并发数应该是 worker_connection * worker_processes / 4

五.Nginx配置详解

#安全问题,建议用nobody,不要用root.
#user  nobody;
 
#worker数和服务器的cpu数相等是最为适宜
worker_processes  2;
 
#work绑定cpu(4 work绑定4cpu)
worker_cpu_affinity 0001 0010 0100 1000
  
#error_log path(存放路径) level(日志等级) path表示日志路径,level表示日志等级,
#具体如下:[ debug | info | notice | warn | error | crit ]
#从左至右,日志详细程度逐级递减,即debug最详细,crit最少,默认为crit。 
#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;
#pid        logs/nginx.pid;
 
events {
    worker_connections  1024;  
 
    #这个值是表示nginx要支持哪种多路io复用。
    #一般的Linux选择epoll, 如果是(*BSD)系列的Linux使用kquene。
    #windows版本的nginx不支持多路IO复用,这个值不用配。
    use epoll;
 
    # 当一个worker抢占到一个链接时,是否尽可能的让其获得更多的连接,默认是off 。
    multi_accept on; //并发量大时缓解客户端等待时间。
    # 默认是on ,开启nginx的抢占锁机制。
    accept_mutex  on; //master指派worker抢占锁
}
http {
    #当web服务器收到静态的资源文件请求时,依据请求文件的后缀名在服务器的MIME配置文件中找到对应的MIME Type,再根据MIME Type设置HTTP Response的Content-Type,然后浏览器根据Content-Type的值处理文件。
    include       mime.types;  #/usr/local/nginx/conf/mime.types
 
    #如果 不能从mime.types找到映射的话,用以下作为默认值-二进制
    default_type  application/octet-stream;
 
     #日志位置
     access_log  logs/host.access.log  main;
 
     #一条典型的accesslog:
     #101.226.166.254 - - [21/Oct/2013:20:34:28 +0800] "GET /movie_cat.php?year=2013 HTTP/1.1" 200 5209 "http://www.baidu.com" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 360Spider"
     #1)101.226.166.254:(用户IP)
     #2)[21/Oct/2013:20:34:28 +0800]:(访问时间) 
     #3)GET:http请求方式,有GET和POST两种
     #4)/movie_cat.php?year=2013:当前访问的网页是动态网页,movie_cat.php即请求的后台接口,year=2013为具体接口的参数
     #5)200:服务状态,200表示正常,常见的还有,301永久重定向、4XX表示请求出错、5XX服务器内部错误
     #6)5209:传送字节数为5209,单位为byte
     #7)"http://www.baidu.com":refer:即当前页面的上一个网页
     #8)"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; #.NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 360Spider": agent字段:通常用来记录操作系统、浏览器版本、浏览器内核等信息
 
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                       '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
 
    #开启从磁盘直接到网络的文件传输,适用于有大文件上传下载的情况,提高IO效率。
    sendfile        on; //大文件传递优化,提高效率
   
    #一个请求完成之后还要保持连接多久,0表示完成请求后直接关闭连接。默认:75s
    keepalive_timeout  60s; 
 
    #开启或者关闭gzip模块, 文件压缩,再传输,提高效率
    #gzip  on ; 
 
    #设置允许压缩的页面最小字节数,页面字节数从header头中的Content-Length中进行获取。
    #gzip_min_lenth 1k;
 
    # gzip压缩比,1 压缩比最小处理速度最快,9 压缩比最大但处理最慢(传输快但比较消耗cpu)
    #gzip_comp_level 4;
 
    #匹配MIME类型进行压缩,(无论是否指定)"text/html"类型总是会被压缩的。
    #gzip_types types text/plain text/css application/json  application/x-javascript text/xml   
 
    #动静分离
    #服务器端静态资源缓存,最大缓存到内存中的文件,不活跃期限
    open_file_cache max=655350 inactive=20s;   
   
    #活跃期限内最少使用的次数,否则视为不活跃。
    open_file_cache_min_uses 2;
 
    #验证缓存是否活跃的时间间隔 
    open_file_cache_valid 30s;
    
    upstream  myserver{
        # ip_hash;
        server 192.168.161.132:8080 weight=1;
        server 192.168.161.132:8081 weight=1 backup;
        #hash $request_uri
        #hash_method crc32
    }
 
    server {
        #监听端口号
        listen       80;
        #服务名
        server_name  192.168.137.129;
        #字符集
        #charset utf-8;
        location / {   #匹配任何查询。
            root   html;#资源查找位置。         /user/local/nginx/html
            #默认访问首页索引文件的名称
            index  index.html index.htm;
            #反向代理路径
            proxy_pass http://myserver;
            #反向代理的超时时间
            proxy_connect_timeout 10;
            proxy_redirect default;
         }
          #普通匹配
        location  /images/ {    
                    root images ;
        }
         #反正则匹配
         location ^~ /images/jpg/ {  # 匹配任何以 /images/jpg/ 开头的任何查询并且停止搜索。任何正则表达式将不会被测试。 
                      root images/jpg/ ;
         }
         #正则匹配
         location ~*.(gif|jpg|jpeg)$ {       
                      #所有静态文件直接读取硬盘
                      root pic ;
                      #expires定义用户浏览器缓存的时间为3天,如果静态页面不常更新,可以设置更长,这样可以节省带宽和缓解服务器的压力
                      expires 3d; 
         }
        #error_page  404              /404.html;
        # redirect server error pages to the static page /50x.html
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        } 
    }
}