nginx一个轻量级的web服务器,同时可以作为反向代理服务器,将web请求分发至后端的realserver。作为webserver 和proxy-server nginx本身来说有什么优点呢?
1、作为web服务器
并发量高,在30000的并发量下,在nginx+PHP(fastcgi)架构下,开启10个nginx进程会消耗10*15=150M内存,开启64个CGI进程会消耗64*20=1280M内存。在内存、cpu的消耗量不是很大的情况下,实现了高并发量。
nginx选用的是epoll网络I/O模型,而apace则采用的是select,所以nginx的处理速度更快。
在10000个非活动连接的长连接的情况下。只需要消耗2.5M内存。
在启动nginx后,主进程master会生成相应数量的worker进程。worker进程用来接收client的请求。如果我们的服务器配置发生了改变。原来已经生成的并且正在为client提供请求的进程继续使用原来的配置。当服务结束之后,master进程将老配置的worker进程终止,在重新生成新的进程。
2、作为proxy服务器
比较流行的反向代理服务器有nginx,haproxy,lvs等,三种反向代理服务器有各自的优缺点:
lvs是基于四层实现的负载均衡,所谓的四层基于的是socket实现反向代理,比如说把A的80请求全部代理到B的80上去。lvs工作四层之上,仅做分发之用,不会产生额外的开销,这就决定的了lvs的性能超强,其对内存和cpu的开销都是很小的。
lvs在代理的过程中,DR单纯的把请求分发到后面的realserver,realserver直接对client端进行响应。所以lvs的分发性能是其他的反向代理服务器不能比较的。
lvs请求图示(DR模型)
nginx对于lvs而言,首先nginx是工作在七层之上的反向代理服务器。所谓的七层表示nginx可以针对某个目录,某个url来进行反向代理。比如说把A服务器的 /app01/这个目录代理到B服务器的/app01/目录。这样就实现了基于应用的反向代理。同时nginx可以实现对后端服务器的健康检查,当分发的请求发生错误之后,会将请求重新分发到另外的realserver,同样nginx可以承受大并发请求,且采用异步请求处理,减轻了后端服务器的压力。
haproxy本身作为作为反向代理服务器,会比nginx具有更好的处理速度,而且可以解决nginx出现的session共享问题。(nginx可以采用ip_hash的调度方法解决)。haproxy同样可以对后端服务器进行健康检查。但是haproxy的配置相对于nginx来说略微复杂(个人意见仅供参考)。
nginx反向代理图示
How nginx
nginx无论作为web服务器还是反向代理服务器,location和正则表达式的灵活应用都是他的一大优势,可以任意的匹配我们想进行操作的url,并对相应的url做rewrite和proxy_pass处理。对于nginx的location匹配我有话说。
1
location分类:正则location和普通的location
正则location:以”~”和”~*”开头,其中*好表示后面的正则表达式忽略大小写
普通location:“=”,“^~ ”和“@ ”和无任何前缀的都属于普通location 。
2
如果nginx配置中两种location都存在,先匹配那个呢,另外location的匹配和书写的顺序有关系吗?
在正则location和普通location都存在的时候,location的匹配规则是先匹配普通的location,在匹配普通location的过程中,遵循的是最长匹配原则。然后再匹配正则的location,但后边匹配到的正则location会覆盖掉先前的普通的location,除非普通的location是完全匹配的。
下面用几个简单的例子加以说明:
1、location =/ {
}
2、location / {
}
3、location ^~ /image/ {
}
4、 location ~* \.(gif|jpg|jpeg)${
}
请求:
/ ----->匹配第一个url
/documents/docment.html ----->匹配第二个url
/images/boc.gif ----->匹配第三个url
/documents/boc.jpg ----->匹配第四个url
解析
1:如果location中明确标注了=号,那么此location只能精确的匹配根/这个location,因为此时是精确匹配,所以不再进行正则的匹配。
2:/documents/docment.html只有/这个location会匹配。虽然前缀不是那么长,但是在这四个location中算是最长的匹配。
3:/images/boc.gif,这个url首先会匹配到/这个普通的location和/image/这两个,但是/image/的匹配前缀更长,所以选择后面的进行匹配。~^表示的是在匹配的过程中,匹配完普通location之后不在进行正则的匹配。
4:/documents/boc.jpg 首先会匹配到/,然后进行正则的匹配,会匹配到最后的~* \.(gif|jpg|jpeg)$,匹配到之后,正则的会把普通的覆盖掉。
location匹配进阶
server {
listen 80;
server_name www.mingpaixinxi.com.cn;
location /boc/test.html {
allow all;
}
location ^~ / {
root html;
index index.html index.htm;
deny all;
}
location ~ \.html$ {
allow all;
}
}
分别访问 curl -I http://www.mingpaixinxi.com.cn/,http://www.mingpaixinxi.com.cn/a.html,http://www.mingpaixinxi.com.cn/boc/test.html,http://www.mingpaixinxi.com.cn/test.html。
总结:为什么除了/boc/test.html之外,其余根开始匹配的全部都返回的是403呢,因为在匹配的过程中,匹配到根路径之后,前面^~说明就不在进行正则的匹配。所以直接执行了里面的deny all请求,所以返回了403。
如果我们把前面的^~符号去掉会发生什么呢?
server {
listen 80;
server_name www.mingpaixinxi.com.cn;
location /boc/test.html {
allow all;
}
location / {
root html;
index index.html index.htm;
deny all;
}
location ~ \.html$ {
allow all;
}
}
总结:除了根的匹配之外,其余的全部是404的返回值,为什么呢,因为location /之后还会进行正则的匹配,结果匹配到了 ~ \.html$ 就会把最开始的进行覆盖,执行里面的allow all(虽然是allow all,但是没有文件,返回是404,404表明请求已经到达了服务器,但是服务器不存在客户端请求的文件,而403表示的是请求根本没有到达服务器直接被拒绝掉,这两个存在本质的区别)就返回了404状态吗。
location的匹配规则你懂了吗?
总结
普通location会先于正则location进行匹配。
如果匹配到普通之后,想结束不再匹配正则的location,那么可以在普通的location前面加上 ^~这两个符号。
如果继续匹配正则location,正则匹配到的结果会覆盖普通匹配到的结果。
匹配正则的过程中,和正则的为上下位置有关系,因为正则location是匹配到一个随即停止匹配。并不存在普通location的最大前缀匹配原则。
3
nginx rewrite规则
在nginx中rewrite可以使我们将url进行灵活的转换,但是nginx在转换的过程中会有许多的坑,下面的这些坑你踩过吗?
rewrite既可以写在server中又可以写在location中,但是写在这两个中有什么区别呢,会有什么先后的顺序吗?
答案是肯定的,如果两者同时出现的话,首先会匹配的是server中的rewrite规则,然后进行匹配的是location中的rewrite规则,那server中location匹配完了之后会在继续匹配location中的rewrite规则吗?如果想解决这个问题,需要简要的说下rewrite的4个flag位。
1、last:匹配完当前的uri之后不在进行匹配。
2、break:匹配完当前的uri之后不在进行匹配。
3、permanent:永久重定向,http请求返回码301。
4、redirect:临时重定向,http请求返回码302。
没看错吧,为什么last和break的定义一样呢?解析的是从官方翻译过来的,下面看几个例子。
server {
listen 80;
server_name www.mingpaixinxi.com.cn ;
root html;
rewrite_log on; # 打开 URL 重写模块的日志开关,以便写入 error_log
location /aaa.html {
rewrite "^/aaa\.html$" /bbb.html;
rewrite "^/bbb\.html$" /ddd.html;
}
location /bbb.html {
rewrite "^/bbb\.html$" /ccc.html;
}
}
请求:
curl http://www.mingpaixinxi.com.cn/aaa.html
返回bbb.html,这个应该不难理解,先是匹配自己location中的uri规则,之后生成的新的uri也会继续匹配,直到匹配完成。
server {
listen 80;
server_name www.mingpaixinxi.com.cn ;
root html;
rewrite_log on; # 打开 URL 重写模块的日志开关,以便写入 error_log
location /aaa.html {
rewrite "^/aaa\.html$" /bbb.html last;
rewrite "^/bbb\.html$" /ddd.html;
}
location /bbb.html {
rewrite "^/bbb\.html$" /ccc.html;
}
}
curl http://www.mingpaixinxi.com.cn/aaa.html
返回ccc.html
为什么会返回的是ccc.html呢,因为rewrite "^/aaa\.html$" /bbb.html last;后面的flag位last,这表明停止当前location中的uri的继续的匹配,但是重新生成的uri不会停止匹配,会继续匹配其他的location,所以匹配到了 /bbb.html,所以返回的是ccc.html。
erver {
listen 80;
server_name www.mingpaixinxi.com.cn ;
root html;
rewrite_log on; # 打开 URL 重写模块的日志开关,以便写入 error_log
location /aaa.html {
rewrite "^/aaa\.html$" /bbb.html break;
rewrite "^/bbb\.html$" /ddd.html;
}
location /bbb.html {
rewrite "^/bbb\.html$" /ccc.html;
}
}
请求:
curl http://www.mingpaixinxi.com.cn/aaa.html
返回bbb.html,当遇到break之后,停止一切的匹配。从此处结束。所以说break比last的力度会更大些。就好像是程序里面的循环一样,遇到break之后,结束所有的循环。
同样,如果rewrite规则同时在server和location中出现,server的总是先于location的匹配,直到匹配结束。
nginx的rewrite规则你了解了吗?
Use nginx
核心配置
upstream boc {
server 192.168.1.1 weight=1 max_fails=2 fail_timeout=2;
server 192.168.1.2 weight=1 max_fails=2 fail_timeout=2;
}
server
{
listen 80;
server_name www.mingpaixinxi.com;
location / {
proxy_pass http://boc;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
access_log off;
}
在这里,定义了一个web的集群,包含两台realserver,并定义了健康检查的规则。当client访问www.mingpaixinxi.com.cn这个域名的时候,前方的nginx就会把请求发送到192.168.1.1和192.168.1.2这两台服务器,默认的分配规则是roundrobin。
上面简单的对nginx作为反向代理服务器和其他的几款反向代理软件简单的做了些比较,也介绍了些nginx中的location和反向代理集群的配置。无论是nginx还是haproxy亦或是lvs。都有自己的优势和不足的地方。没有那个好那个坏的区分。在应用中,选择自己合适的才是最好的。正所谓无论白猫还是黑猫,能抓到老鼠的都是好猫。