执行systemctl start keepalived命令启动keepalived服务
执行完之后立马执行systemctl status keepalived,发现服务状态OK
ps -ef | grep keepalived也能看到keepalived进程
但是过一会再看,发现进程没了
systemctl status keepalived也显示inactive(dead)状态
通过ip -br a命令验证是否达到预期,发现vip配置也确实没生效
keepalived日志默认是在 /var/log/messages
比较郁闷的是,服务器居然没开启rsyslog服务,导致我看不到日志
通过systemctl start rsyslog启动rsyslog,终于在/var/log/messages中看到报错日志,如下图:
看到这个报错其实开始也挺懵的,网上搜了一些资料,大致原因定位到是内核加载ip_vs模块的时候报错,执行modprobe ip_vs也报相同的错,如下图:
然后按网上说法,
先modinfo ip_vs
再insmod /lib/modules/3.10.0-862.el7.x86_64/kernel/net/netfilter/ipvs/ip_vs.ko.xz
也报Operation not permitted
然后有说通过dmesg命令来查看信息的,很可惜我执行这个命令没有任何输出,/var/log/dmesg文件也不存在。
这时候我其实已经有点没办法了,感觉我用的这台机器问题挺多的,一怒之下,我直接执行了reboot命令重启机器
然后就是见证奇迹的时候,果然重启大法好,再执行modprobe ip_vs居然没报错
执行systemctl start keepalived,进程没再自动结束
执行ip -br a,结果也跟我预期相符了
虽然最后成功了,但是真实原因如何,其实我还是有点懵的。
开始以为是开启了secure boot,但是又感觉有点不合理,虽然secure boot会导致无法加载不受信任的内核模块,但是不应该影响ip_vs才对,而且重启也不会影响secure boot啊。
关于secure boot可以看下这篇文章:
https://docs.oracle.com/en/operating-systems/oracle-linux/secure-boot/sb-about.html
然后就是推测是有些依赖的服务没启动,开机后自动启动了。
那问题又来了,是什么服务要系统重启后才启动,之前是为啥关了呢~~
我再使劲回忆,貌似这台机器的负载经常很高,老有服务被oom kill。rsyslog应该就是被oom kill了。
至于是什么服务被kill了导致安装内核模块报错,暂时还没有答案,以后遇到再深究吧