一,nginx的负载均衡集群的特点:
1,nginx集群和lvs的不同?
lvs集群:工作在第4层(传输层)
nginx集群:工作在第7层(应用层)
lvs集群:性能更强
nginx集群:功能更强:可以针对域名/目录等进行配置
lvs:不支持重发请求
nginx集群:检测到错误后可以重发请求
2,调度算法有哪些?
rr (轮询)
wrr (就是rr的基础上加上权重weight)
ip_hash (根据ip分发)
url_pash (根据url分发)
least_conn (分发给连接数少的机器)
fair (按响应时间分发,是第三方的算法,如使用需要安装时添加相应的模块)
说明:刘宏缔的架构森林是一个专注架构的博客,
网站:https://blog.imgtouch.com本文: https://blog.imgtouch.com/index.php/2023/05/22/nginx-pei-zhi-fu-zai-jun-heng-ji-qun-nginx1180/
对应的源码可以访问这里获取: https://github.com/liuhongdi/
说明:作者:刘宏缔
二,我们作为例子的nginx负载均衡集群的结构:
loader: 172.18.1.1 loadbalancer,负责作为负载均衡的入口
web1: 172.18.1.2 后端的web机器之一
web2: 172.18.1.3 后端的web机器之二
三,loader上负载均衡集群的配置
1,编辑配置文件:用upstream定义一个集群
#upstream :定义一个上游服务器集群
#webcluster :集群的名称,用来区分
#server 172.18.1.2:80 指定集群的机器ip的端口
upstream webcluster{
server 172.18.1.2:80;
server 172.18.1.3:80;
}
2,在server配置访问中使用上面定义的webcluster集群
server {
listen 80;
server_name localhost;
location / {
proxy_set_header X-Real-IP $remote_addr;
proxy_buffering off;
proxy_connect_timeout 5;
proxy_read_timeout 5;
proxy_send_timeout 5;
proxy_pass http://webcluster;
}
}
3,配置中各个指令的说明:
proxy_pass
将代理转发给上方 upstream 中配置的集群中的两台服务器去处理
X-Real-IP
用来得到真实ip,否则在后端看到的都是loader的ip
proxy_set_header X-Real-IP $remote_addr;
proxy_buffering
默认值是on,这里我们把它关闭,off
它负责开启从后端被代理服务器的响应body缓冲,
我们需要从后端服务器按收实时的数据,所以关闭
proxy_connect_timeout
该指令设置与upstream server的连接超时时间,默认值60s,最高不能超过75秒
注意这个不是等待后端返回页面的时间(那个时长是由proxy_read_timeout变量来定义)。
如果upstream服务器正在运行中,但是没有响应
则这个指令不会起作用,因为与upstream服务器的连接已经建立
proxy_read_timeout
该指令设置与代理服务器的读超时时间。它决定了nginx会等待多长时间来获得请求的响应
如果两次读操作之间经过指定的时间还收不到upstream响应的数据,视为超时
默认值:60s
proxy_send_timeout
这个指定设置了发送请求给upstream服务器的超时时间
如果两次写操作之间经过指定的时间不能发送到upstream,视为超时
默认值:60s
四,nginx集群的轮循算法:
1,默认算法:轮询
轮询是upstream的默认分配方式,
每个请求按照时间顺序轮流分配到不同的后端服务器
2,使用ip_hash算法:
# ip_hash: 根据ip地址做hash,使同一个ip发出的请求能分发到相同的后端机器
upstream webcluster{
ip_hash;
server 172.18.1.2:80;
server 172.18.1.3:80;
}
如果同一个ip发出的请求能分发到相同的后端机器,
则一定程度上可以提高访问效率,因为可以避免多次建立http连接
注意:如果用户使用带有服务端缓存功能的浏览器(比如微信的内置浏览器),
则用户的ip地址会发生变化,
所以如果做session共享时不能寄希望于ip_hash
3,使用url_hash算法
说明: url hash把相同的请求地址转发到后端相同的机器
upstream webcluster{
hash $request_uri;
server 172.18.1.2:80;
server 172.18.1.3:80;
}
如果后端的web服务机器上有本地缓存,且缓存内容不同,可以使用这种方式
因为可以提高缓存命中率,缩短访问时间
比如:供下载用的文件缓存到web服务器
如果缓存内容相同,例如 redis缓存页面内容,则使用url_hash带来的益外不大
五,负载均衡的参数例子:
1,weight:
机器在集群中占的权重,默认值是1
weight越大,负载的权重就越大,
如果后端服务器的性能或带宽有差异时,可以用这个值来调整压力的分配
例子:
upstream webcluster{
server 172.18.1.2:80 weight=1;
server 172.18.1.3:80 weight=2;
}
说明:使用ip_hash和url_hash算法时weight不生效
2,max_fails /fail_timeout
例子:
upstream webcluster{
server 172.18.1.2:80 max_fails=3 fail_timeout=60s;
server 172.18.1.3:80 max_fails=3 fail_timeout=60s;
}
在fail_timeout参数定义的时间段内,如果失败的次数达到max_fails的值,Nginx就认为服务器不可用,标记此机器为fail,
当前的fail_timeout时长内不再尝试连接,
到下一个再去尝试请求,如果连接成功,则恢复之前的分发,
如果仍然不可用,则继续等到下一个周期再尝试
默认值:
fail_timeout为10s
max_fails为1次
建议值:
机器出故障一般没那么容易恢复,
建议设置为: 3/60
说明:
后端服务器连接失败时,会记录到error_log日志中:
例:
2020/05/12 05:44:32 [error] 483#0: *7 connect() failed (111: Connection refused) while connecting to upstream,
client: 172.18.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "http://172.18.1.3:80/", host: "192.168.3.59"
3,down
表示此服务器已被手动停用
例子:
upstream webcluster{
server 172.18.1.2:80 max_fails=3 fail_timeout=60s down;
server 172.18.1.3:80 max_fails=3 fail_timeout=60s;
}
4,backup
表示此服务器是备用服务器,
只有其它后端服务器都宕机或者很忙才会访问到
所以在集群中压力最小
例:
upstream webcluster{
server 172.18.1.2:80 max_fails=3 fail_timeout=60s;
server 172.18.1.3:80 max_fails=3 fail_timeout=60s backup;
}
六,查看nginx版本
[root@centos8 playbook]# /usr/local/soft/nginx-1.18.0/sbin/nginx -v
nginx version: nginx/1.18.0