执行systemctl start keepalived命令启动keepalived服务
执行完之后立马执行systemctl status keepalived,发现服务状态OK
ps -ef | grep keepalived也能看到keepalived进程

但是过一会再看,发现进程没了
systemctl status keepalived也显示inactive(dead)状态
通过ip -br a命令验证是否达到预期,发现vip配置也确实没生效

keepalived日志默认是在 /var/log/messages
比较郁闷的是,服务器居然没开启rsyslog服务,导致我看不到日志

通过systemctl start rsyslog启动rsyslog,终于在/var/log/messages中看到报错日志,如下图:

keepalived 启动方式 keepalived启动不起来_oracle


看到这个报错其实开始也挺懵的,网上搜了一些资料,大致原因定位到是内核加载ip_vs模块的时候报错,执行modprobe ip_vs也报相同的错,如下图:

keepalived 启动方式 keepalived启动不起来_keepalived 启动方式_02

然后按网上说法,
先modinfo ip_vs
再insmod /lib/modules/3.10.0-862.el7.x86_64/kernel/net/netfilter/ipvs/ip_vs.ko.xz
也报Operation not permitted

然后有说通过dmesg命令来查看信息的,很可惜我执行这个命令没有任何输出,/var/log/dmesg文件也不存在。

这时候我其实已经有点没办法了,感觉我用的这台机器问题挺多的,一怒之下,我直接执行了reboot命令重启机器

然后就是见证奇迹的时候,果然重启大法好,再执行modprobe ip_vs居然没报错
执行systemctl start keepalived,进程没再自动结束
执行ip -br a,结果也跟我预期相符了

虽然最后成功了,但是真实原因如何,其实我还是有点懵的。

开始以为是开启了secure boot,但是又感觉有点不合理,虽然secure boot会导致无法加载不受信任的内核模块,但是不应该影响ip_vs才对,而且重启也不会影响secure boot啊。

关于secure boot可以看下这篇文章:

https://docs.oracle.com/en/operating-systems/oracle-linux/secure-boot/sb-about.html

keepalived 启动方式 keepalived启动不起来_重启_03

然后就是推测是有些依赖的服务没启动,开机后自动启动了。
那问题又来了,是什么服务要系统重启后才启动,之前是为啥关了呢~~
我再使劲回忆,貌似这台机器的负载经常很高,老有服务被oom kill。rsyslog应该就是被oom kill了。
至于是什么服务被kill了导致安装内核模块报错,暂时还没有答案,以后遇到再深究吧