记录
线上业务中使用springboot的默认redis连接,当收到业务请求时最后打印日志:
[INFO ] 10:31:45.303 [lettuce-eventExecutorLoop-1-38] i.l.core.protocol.ConnectionWatchdog - Reconnecting, last destination was redis-service/XX.XXX.XXX.XXX:6379
[INFO ] 10:31:45.329 [lettuce-nioEventLoop-4-2] i.l.c.protocol.ReconnectionHandler - Reconnected to redis-service:6379
然后业务中断,没有其他日志打印,线上日志级别为info
前面研究了下连接池的各个参数,改完不管三七二十一先上去看看,不过不明白为什么连个错误日志也没有,如果连不上只有来个异常啊,到底被谁吃了,开始跟代码。
首先看ReconnectionHandler,就是一个断开重连的方法,主要用的netty的api,如果出错都能抛出异常,查找无果,往上层找。
找到ConnectionWatchdog 的run方法,他本身就声明了抛出exception,而且也没有吃异常,只能再往外找,找到scheduleReconnect()方法,这块开始反过来
reconnectWorkers.submit(() -> {
ConnectionWatchdog.this.run(attempt);
return null;
});
这里重试的执行是使用了一个reconnectWorkers执行的,这个reconnectWorkers是一个EventExecutorGroup对象,也就是这个重试是使用了特定的线程池,警觉起来了哈。
开始追踪线城池是个啥(弱鸡流程,以前没太看过netty)。reconnectWorkers是在ConnectionWatchdog的初始化时指定的,在ConnectionBuilder这个构造器中。
protected ConnectionWatchdog createConnectionWatchdog() {
if (connectionWatchdog != null) {
return connectionWatchdog;
}
LettuceAssert.assertState(bootstrap != null, "Bootstrap must be set for autoReconnect=true");
LettuceAssert.assertState(timer != null, "Timer must be set for autoReconnect=true");
LettuceAssert.assertState(socketAddressSupplier != null, "SocketAddressSupplier must be set for autoReconnect=true");
ConnectionWatchdog watchdog = new ConnectionWatchdog(clientResources.reconnectDelay(), clientOptions, bootstrap, timer,
clientResources.eventExecutorGroup(), socketAddressSupplier, reconnectionListener, connection);
endpoint.registerConnectionWatchdog(watchdog);
connectionWatchdog = watchdog;
return watchdog;
}
继续找clientResources的写入方式。防线是通过set方式写入,主要区分了两种不同redis的部署方式,我这里没有使用集群,追到redisClient的connectStatefulAsync方法。
继续找到了AbstractRedisClient这个基类的构造方法
protected AbstractRedisClient(ClientResources clientResources) {
if (clientResources == null) {
sharedResources = false;
this.clientResources = DefaultClientResources.create();
} else {
sharedResources = true;
this.clientResources = clientResources;
}
genericWorkerPool = this.clientResources.eventExecutorGroup();
channels = new DefaultChannelGroup(genericWorkerPool.next());
timer = (HashedWheelTimer) this.clientResources.timer();
}
如果为空,则有一个默认方式构造,不为空的话则使用传入的,这里我还往下追了下,不过发现越追越乱,然后回到这重新想了下,玩游戏时候的s/l大法开始起作用,打断点吧还是。
AbstractRedisClient 的98行this.clientResources = DefaultClientResources.create();打上断点,但是竟然没跑,在这纠结了好久。
最后在DefaultClientResources的create里打上断点,终于过来了,原来在lettuce的配置类中,默认就配置了这个默认的clientResource,详见LettuceConnectionConfiguration
然后终于找到了本体的DefaultEventExecutor,这个类继承SingleThreadEventExecutor,然后在SingleThreadEventExecutor里找到了一圈,发现了这个宝贝方法:doStartThread()
try {
SingleThreadEventExecutor.this.run();
success = true;
} catch (Throwable t) {
logger.warn("Unexpected exception from an event executor: ", t);
} finally {
再看了下,可能就是这里把我得异常都吃了。
做梦到此为止,不过完全不解决我得问题,确实他把我异常吃了,不过他这个重连策略我肯定是解决不了的,因为:
我的服务部署在了k8s里,redis是使用service访问的,他的重连使用的是SocketAddress,这个就逆天了,会直接连ip,k8s都懂的,连ip就是扯淡,左右无法,看起来要强制使用jedis了,哪位大神有好的办法吗?