微服务-服务追踪系统
在一个庞大的微服务系统架构下,如果某一次服务请求出现了问题,那么我们如何定位是哪台机器又或是哪个接口出现了问题。
这时候,我们就需要服务追踪系统来查询。
服务追踪的作用:
1.定位请求出错的位置
2.优化系统调用瓶颈,可以分析每一个接口的调用延时,从而优化相应的接口。
3.优化请求链路调用,在服务追踪系统中,我们可以看到每个接口调用另一个接口的信息,查看在逐个调用中是否存在着不合理的跨区域的调用。
4.生成网络拓扑图,通过网络拓扑图,可以分析出整个RPC的架构和性能信息。
5.透明传输数据,做A/B测试。
注:什么是A/B测试?同时发布两个版本的内容供用户使用,调研这两个版本哪个更受用户欢迎及采用哪个版本。
服务追踪系统的原理
最原始的是由Google发表的Dapper论文。
核心理念是产生一个请求的完整调用链,通过一个在请求的第一层产生一个全局的ID,在整个请求过程中传递,最后通过ID还原出整个的请求链路。
有名的服务追踪系统:Zipkin;鹰眼;MTrace。
三个基础概念:
traceId:用于表示某一个请求在全局的唯一ID。由请求在RPC调用网络中的第一层生成。
spanId:用于标识一次RPC调用在分布式请求中的位置,调用了哪台机器的哪个接口。
annotation:业务自定义的埋点,上传在请求处理过程中,需要后台记录的信息。
服务追踪系统架构
一. 数据采集层
在业务的代码中进行埋点,并将数据进行上报。
二. 数据处理
数据处理分为两类:实时计算需求,离线计算需求
1. 实时计算需求
一般采用Storm或者Spark Streaming进行流式处理方式进行实时的聚合加工,采用OLTP数据仓库(HBase)。
2. 离线数据处理
采用MapReduce或者Spark批处理程序计算,采用Hive存储。
三. 数据展示
两种方式:调用连路图,调用拓扑图。
追问:实时监控系统和服务追踪系统,这两个系统的相同点和区别?
两个系统均由数据采集、数据处理、数据展示三部分。
服务追踪系统是帮助程序员在查看快速定位请求出错在全局的位置,是哪个接口出现问题。
实时监控系统是帮助程序员查看出错接口的具体数据是多少。