1 分布式追踪系统

随着大量公司把单体应用重构为微服务,对于运维人员的责任就更加重大了。架构更复杂、应用更多,要从中快速诊断出问题、找到性能瓶颈,并不是一件容易的事。因此,也随着诞生了一系列面向DevOps的诊断与分析系统,主要是以下三个系统:

  • 集中式日志系统(Logging)
  • 集中式度量系统(Metrics)
  • 分布式追踪系统(Tracing)

三者相互交织重叠如下:




springboot neetty udp服务端 springboot udp接收_UI


loggin_metrics_tracing

技术栈上的成熟框架有,

Logging:Log4j、ELK等,

Metrics:Prometheus、InfluxDB、Grafana等

Tracing:Jaeger和Zipkin等。

分布式追踪系统在Google发表一篇文章Dapper, a Large-Scale Distributed Systems Tracing Infrastructure后快速发展。Tracing系统一般核心步骤有三个:代码埋点、数据存储、查询展示。

历史洪流滚滚向前,大浪淘沙,现在比较流行的有Jaeger和Zipkin。

2 OpenTracing

由于Tracing的技术发展迅速,为了解决兼容性问题,有了OpenTracing规范。它是一个轻量级的标准化层,连接应用、类库和追踪系统。


springboot neetty udp服务端 springboot udp接收_docker_02


OpenTracing的优势:

(1)OpenTracing已经进入CNCF(云原生计算基金会,口号是坚持和整合开源技术来编排容器作为微服务架构的一部分),正在为全球的分布式追踪,提供统一的概念和数据标准。

(2)OpenTracing通过提供平台无关、厂商无关的API,使得开发人员能够方便添加和更换追踪系统的实现。

2.1 相关概念

Trace:贯穿一个分布式系统的事务追踪描述,其实就是由许多个Span组成的有向无环图。

Span:被命名的与记录时间的调用操作,如一个Http GET请求;Span有嵌套关系,如果一个请求会调用其它服务,就会生成子Span。

Tag:一组由键值对构成的标签集合,键值类型必须为字符串。它可以带上许多有用信息,如请求方法、请求URL、返回状态码等。

Log:一组Span的日志集合。

2.2 OpenTracing的实现

Jaeger是Uber推出的一款开源分布式追踪系统,兼容OpenTracing API。架构如下:


springboot neetty udp服务端 springboot udp接收_ci_03


Zipkin是由Twitter推出的开源的分布式追踪系统,架构图如下:


springboot neetty udp服务端 springboot udp接收_UI_04


3 实战整合

本文以Springboot为Web项目,分别整合Jaeger和Zipkin。

3.1 Springboot项目准备

项目中的Controller,提供了两个Endpoint,tracing和open;在访问open时,代码会调用tracing。

@RestControllerpublic class TracingController {    @Autowired    private RestTemplate restTemplate;    @Value("${server.port}")    private int port;    @RequestMapping("/tracing")    public String tracing() throws InterruptedException {        Thread.sleep(100);        return "tracing";    }    @RequestMapping("/open")    public String open() throws InterruptedException {        ResponseEntity response =           restTemplate.getForEntity("http://localhost:" + port + "/tracing",                                     String.class);        Thread.sleep(200);        return "open " + response.getBody();    }}

为了能够方便看出调用时长信息,特别在代码中增加了延时Thread.sleep()。

配置Web应用的端口和服务名字:

server.port=80spring.application.name=opentracing-demo

3.2 整合Jaeger

3.2.1 Springboot整合

引用依赖:

io.opentracing.contrib  opentracing-spring-jaeger-web-starter  3.1.1

配置连接属性:

opentracing.jaeger.enabled=trueopentracing.jaeger.udp-sender.host=localhostopentracing.jaeger.udp-sender.port=6831

3.2.2 Docker运行Jaeger

为了方便,使用docker来运行Jaeger:

# 拉取jaeger镜像docker pull jaegertracing/all-in-one:1.17# 运行jaeger实例,docker run -d --name jaeger   -e COLLECTOR_ZIPKIN_HTTP_PORT=9411   -p 5775:5775/udp   -p 6831:6831/udp   -p 6832:6832/udp   -p 5778:5778   -p 16686:16686   -p 14268:14268   -p 14250:14250   -p 9411:9411   jaegertracing/all-in-one:1.17

以上端口的信息如下:


springboot neetty udp服务端 springboot udp接收_UI_05


3.2.3 运行与访问UI

启动Web应用和Jaeger后,访问服务:

http://localhost/open

http://localhost/tracing

访问Jaeger UI界面http://localhost:16686/,设置好查询条件后点击Find Traces,就能查看到Trace信息了,具体如下:


springboot neetty udp服务端 springboot udp接收_ci_06


选择一条Trace点进去后,可以看到详细信息,非常有利于我们分析,具体如下:


springboot neetty udp服务端 springboot udp接收_UI_07


3.3 Zipkin

3.3.1 Springboot整合

引用相关依赖:

io.opentracing.contrib  opentracing-spring-zipkin-web-starter  0.1.4

配置相关连接信息:

opentracing.zipkin.enabled=trueopentracing.zipkin.http-sender.base-url=http://localhost:9412/

3.3.2 Docker运行Zipkin

通过Docker运行Zipkin实例:

# 拉取Zipkin镜像docker pull openzipkin/zipkin:2.21# 运行Zipkin实例docker run -d -p 9412:9411 openzipkin/zipkin:2.21

因为本机的端口9411已经被Jaeger的docker实例占用,所以改为9412。

3.3.3 运行与访问UI

启动Web应用和Zipkin后,访问服务:

http://localhost/open

http://localhost/tracing

访问Zipkin UI界面http://localhost:9412/zipkin/,设置好查询条件后点击查询,就能查看到Trace信息了,具体如下:


springboot neetty udp服务端 springboot udp接收_UI_08


选择一条Trace点击进去,同样可以看到许多详细信息,这里不在展示。