skywalking rpc 请求日志中TID 为空_apache

准备工作

前一篇博客有写道,idea如何使用源码启动skywalking,可以先查看下前一篇博客。

环境

描述

skywalking-java (master)

https://github.com/apache/skywalking-java

skywalking (master)

https://github.com/apache/skywalking

拦截流程分析

看到这个http请求流程,返回了一个trace链路的信息,skywalking是怎么拦截请求的呢?简单分析下:

skywalking rpc 请求日志中TID 为空_apache_02


从哪里下手呢,看到返回的字段componet返回值为SpringMVC,我们在skywalking-java这个源代码里面搜索下这个关键字。我猜测这个应该是个枚举或者常量。

skywalking rpc 请求日志中TID 为空_java_03


接着进入这个org.apache.skywalking.apm.network.trace.component.ComponentsDefine,找到这个地方,看这个常量在哪个地方引用。两个测试类,那就是最后一个org.apache.skywalking.apm.plugin.spring.mvc.commons.interceptor.AbstractMethodInterceptor

skywalking rpc 请求日志中TID 为空_intellij-idea_04


这里面有三个方法,从字面上看就是方法执行前,方法执行后,方法异常处理。

skywalking rpc 请求日志中TID 为空_java_05


请求下接口,走查下代码,

skywalking rpc 请求日志中TID 为空_apache_06


skywalking rpc 请求日志中TID 为空_服务端_07


可以看到,也确实和猜想一样,也可以看到,这里封装一些http 的trace信息,这里不做深度分析,那什么时候上报给服务端的呢?接着看。

agent端分析

我猜测是拦截你的方法最后一步做的上报,有一段代码ContextManager.stopSpan(),这里代码确实走到这个地方了。

skywalking rpc 请求日志中TID 为空_java_08


来看看这个方法都做了哪些事了?由于这个调用链路太长了,我把最后存储数据的地方打了断点,这个调用流程可以看到,这里简单理解就是放到一个buffer数组里面,那谁去消费这个数据呢,这里又是一个生产消费者模式。

skywalking rpc 请求日志中TID 为空_spring_09

再看这个buffer这个结构,其实可以发现有两个重载方法,obtain意思就是获取,命名规范太重要了,那来打个断点看下。

skywalking rpc 请求日志中TID 为空_服务端_10


看下调用栈,最原始可以看到是专门有一个线程在拉数据,这个run方法也许逻辑的关键所在,再来看下。

skywalking rpc 请求日志中TID 为空_服务端_11


这个ConsumerThread方法继承Thread,那这个线程类什么时候启动的呢,我们已经找到在哪个地方消费了,现在我们再找下这个是如何触发消费的。

skywalking rpc 请求日志中TID 为空_apache_12


这里是需要重启你的被监控的服务,会进入org.apache.skywalking.apm.commons.datacarrier.consumer.ConsumeDriver#begin,这个地方会初始化一个线程去取trace数据,详细流程可以根据这个线程调用顺序跟踪,这里不做深入分析。(这里有个技巧,如果看源码找不到调用处是哪里,可以想办法让断点走到这里,看下线程调用情况)

skywalking rpc 请求日志中TID 为空_java_13


那我们目的是要找到哪个地方上传给服务端的呢?继续找,找到一个consume方法,我们来看下这个consumer变量是哪个实例,再来一次请求,打个断点

skywalking rpc 请求日志中TID 为空_spring_14


可以看到是org.apache.skywalking.apm.agent.core.remote.TraceSegmentServiceClient#consume,这个类,我们进到这个类里面。

skywalking rpc 请求日志中TID 为空_java_15


可以看到最终是grpc的stub和oap服务端交互的

skywalking rpc 请求日志中TID 为空_intellij-idea_16

oap 服务端分析

org.apache.skywalking.oap.server.receiver.trace.provider.handler.v8.grpc.TraceSegmentReportServiceHandler#collect 会进入这个方法里面,如下:

skywalking rpc 请求日志中TID 为空_spring_17

traceId全流程分析

  • agent traceId: 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003

skywalking rpc 请求日志中TID 为空_apache_18

  • server traceId 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003

skywalking rpc 请求日志中TID 为空_spring_19

  • ui查询 traceId 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003

skywalking rpc 请求日志中TID 为空_java_20