准备工作
前一篇博客有写道,idea如何使用源码启动skywalking,可以先查看下前一篇博客。
环境 | 描述 |
skywalking-java (master) | |
skywalking (master) |
拦截流程分析
看到这个http请求流程,返回了一个trace链路的信息,skywalking是怎么拦截请求的呢?简单分析下:
从哪里下手呢,看到返回的字段componet
返回值为SpringMVC
,我们在skywalking-java这个源代码里面搜索下这个关键字。我猜测这个应该是个枚举或者常量。
接着进入这个org.apache.skywalking.apm.network.trace.component.ComponentsDefine
,找到这个地方,看这个常量在哪个地方引用。两个测试类,那就是最后一个org.apache.skywalking.apm.plugin.spring.mvc.commons.interceptor.AbstractMethodInterceptor
。
这里面有三个方法,从字面上看就是方法执行前,方法执行后,方法异常处理。
请求下接口,走查下代码,
可以看到,也确实和猜想一样,也可以看到,这里封装一些http 的trace信息,这里不做深度分析,那什么时候上报给服务端的呢?接着看。
agent端分析
我猜测是拦截你的方法最后一步做的上报,有一段代码ContextManager.stopSpan()
,这里代码确实走到这个地方了。
来看看这个方法都做了哪些事了?由于这个调用链路太长了,我把最后存储数据的地方打了断点,这个调用流程可以看到,这里简单理解就是放到一个buffer数组里面,那谁去消费这个数据呢,这里又是一个生产消费者模式。
再看这个buffer这个结构,其实可以发现有两个重载方法,obtain意思就是获取,命名规范太重要了,那来打个断点看下。
看下调用栈,最原始可以看到是专门有一个线程在拉数据,这个run方法也许逻辑的关键所在,再来看下。
这个ConsumerThread方法继承Thread,那这个线程类什么时候启动的呢,我们已经找到在哪个地方消费了,现在我们再找下这个是如何触发消费的。
这里是需要重启你的被监控的服务,会进入org.apache.skywalking.apm.commons.datacarrier.consumer.ConsumeDriver#begin
,这个地方会初始化一个线程去取trace数据,详细流程可以根据这个线程调用顺序跟踪,这里不做深入分析。(这里有个技巧,如果看源码找不到调用处是哪里,可以想办法让断点走到这里,看下线程调用情况)
那我们目的是要找到哪个地方上传给服务端的呢?继续找,找到一个consume方法,我们来看下这个consumer变量是哪个实例,再来一次请求,打个断点
可以看到是org.apache.skywalking.apm.agent.core.remote.TraceSegmentServiceClient#consume
,这个类,我们进到这个类里面。
可以看到最终是grpc的stub和oap服务端交互的
oap 服务端分析
org.apache.skywalking.oap.server.receiver.trace.provider.handler.v8.grpc.TraceSegmentReportServiceHandler#collect
会进入这个方法里面,如下:
traceId全流程分析
- agent traceId: 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003
- server traceId 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003
- ui查询 traceId 073f2f55de0b4fa5afcbb60a331c9157.47.16409465032310003