主从多台nginx,其中有一台出现宕机,怎样处理?
实现nginx+keepalived
keepalived 常用命令
service keepalived start
service keepalived stop
启动主备的nginx和keepalived
如果其中的主nginx宕机,使用keepalived中的keepalived.conf对nginx监控
自动切换服务器节点,
两台keeplived的虚拟ip一致的,如果主keeplived挂了,会把虚拟ip分配给从服务器
配置nginx主备自动重启
第三步:对配置文件进行修改:vim /etc/keepalived/keepalived.conf
keepalived.conf配置文件说明:
(一)Master 主
! Configuration File for keepalived
global_defs {
router_id bhz005 ##标识节点的字符串,通常为hostname
}
keepalived 会定时执行脚本并且对脚本的执行结果进行分析,动态调整vrrp_instance的优先级。这里的权重weight 是与下面的优先级priority有关,如果执行了一次检查脚本成功,则权重会-20,也就是由100 - 20 变成了80,Master 的优先级为80 就低于了Backup的优先级90,那么会进行自动的主备切换。
如果脚本执行结果为0并且weight配置的值大于0,则优先级会相应增加。
如果脚本执行结果不为0 并且weight配置的值小于0,则优先级会相应减少。
vrrp_script chk_nginx {
script "/etc/keepalived/nginx_check.sh" ##执行脚本位置
interval 2 ##检测时间间隔
weight -20 ## 如果条件成立则权重减20(-20)
}
定义虚拟路由 VI_1为自定义标识。
vrrp_instance VI_1 {
state MASTER ## 主节点为MASTER,备份节点为BACKUP
## 绑定虚拟IP的网络接口(网卡),与本机IP地址所在的网络接口相同(我这里是eth6)
interface eth6
virtual_router_id 172 ## 虚拟路由ID号
mcast_src_ip 192.168.1.172 ## 本机ip地址
priority 100 ##优先级配置(0-254的值)
Nopreempt ##
advert_int 1 ## 组播信息发送间隔,俩个节点必须配置一致,默认1s
authentication {
auth_type PASS
auth_pass bhz ## 真实生产环境下对密码进行匹配
}
track_script {
chk_nginx
}
virtual_ipaddress {
192.168.1.170 ## 虚拟ip(vip),可以指定多个
}
}
(二)Backup 从
! Configuration File for keepalived
global_defs {
router_id bhz006
}
vrrp_script chk_nginx {
script "/etc/keepalived/nginx_check.sh"
interval 2
weight -20
}
vrrp_instance VI_1 {
state BACKUP
interface eth7
virtual_router_id 173
mcast_src_ip 192.168.1.173
priority 90 ##优先级配置
advert_int 1
authentication {
auth_type PASS
auth_pass bhz
}
track_script {
chk_nginx
}
virtual_ipaddress {
192.168.1.170
}
}
(三)nginx_check.sh 脚本:
#!/bin/bash
A=`ps -C nginx –no-header |wc -l`
if [ $A -eq 0 ];then
/usr/local/nginx/sbin/nginx
sleep 2
if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
killall keepalived
fi
fi
(四)我们需要把master的keepalived配置文件 copy到master机器(172)的 /etc/keepalived/ 文件夹下,在把backup的keepalived配置文件copy到backup机器(173)的 /etc/keepalived/ 文件夹下,最后把nginx_check.sh脚本分别copy到两台机器的 /etc/keepalived/文件夹下。
(五)nginx_check.sh脚本授权。赋予可执行权限:chmod +x /etc/keepalived/nginx_check.sh
(六)启动2台机器的nginx之后。我们启动两台机器的keepalived
/usr/local/nginx/sbin/nginx
service keepalived start
ps -ef | grep nginx
ps -ef | grep keepalived
可以进行测试,首先看一下俩台机器的ip a 命令下 都会出现一个虚拟ip,我们可以停掉 一个机器的keepalived,然后测试,命令:service keepalived stop。结果发现当前停掉的机器已经不可用,keepalived会自动切换到另一台机器上。
Nginx解决ddos流量攻击?
#限制IP的每秒请求次数
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/s;
#限制同一个IP同一时间内创建连接次数
limit_conn_zone $binary_remote_addr zone=addr:10m;
采用nginx——keeplived(多台)
tomcat宕机?(多台)
proxy_connect_timeout 1; 连接时间
proxy_read_timeout 1; 该指令设置与代理服务器的读超时时间。它决定了nginx会等待多长时间来获得请求的响应。
proxy_send_timeout 1;这个指定设置了发送请求给upstream服务器的超时时间。
tomcat宕机?(单台的话)
需要写一个shell.sh脚本进行监控
#!/bin/sh
获取tomcat进程ID/usr/local/tomcat
TomcatID=$(ps -ef |grep tomcat |grep -w ‘tomcat’|grep -v ‘grep’|awk ‘{print KaTeX parse error: Expected 'EOF', got '}' at position 2: 2}̲') tomcat启动程序(这…(date +’%F %H:%M:%S’)]"
if [[ KaTeX parse error: Expected 'EOF', got '#' at position 18: …mcatID ]];then #̲ 这里判断TOMCAT进程是否…TomcatID,继续检测页面…"
检测是否启动成功(成功的话页面会返回状态"200")??
TomcatServiceCode=$(curl -I -m 10 -o /dev/null -s -w %{http_code} $WebUrl)
if [ TomcatServiceCode,tomcat启动成功,测试页面正常…"
else
echo “[error]tomcat页面出错,请注意…状态码为GetPageInfo”
echo “[error]页面访问出错,开始重启tomcat”
kill -9 $TomcatID# 杀掉原tomcat进程
sleep 3
rm -rf $TomcatCache # 清理tomcat缓存
StartTomcat,请稍候…"
#rm -rf $TomcatCache
$StartTomcat
fi
echo “------------------------------”??
}