Application Performance Management
相对于传统的监控软件(Falcon、Zabbix)的区别,APM跟关注在对于系统内部执行、系统间调用的性能瓶颈分析,这样更有利于定位到问题的具体原因,传统监控软件只提供一些零散的监控点和指标,就算告警了也不知道问题是出在哪里。
现代APM体系,基本都是参考Google的Dapper(大规模分布式系统的跟踪系统)的体系来做的。
通过跟踪请求的处理过程,来对应用系统在前后端处理、服务端调用的性能消耗进行跟踪,关于Dapper的介绍(Dapper,大规模分布式系统的跟踪系统 by bigbully)可以看这个链接:http://bigbully.github.io/Dapper-translation/
我所知道相对有名的APM系统主要有以下几个:
1、Pinpoint
github地址:https://github.com/naver/pinpoint 是用JAVA开发的,在这个项目的主页还有些别的监控项目也不错https://github.com/naver/,这个是通过JavaAgent的机制来做字节码代码植入,实现加入traceid和抓取性能数据的目的。
NewRelic、Oneapm之类的工具在java平台上的性能分析也是类似的机制。
2、Zipkin
官网:https://zipkin.io/
github地址:https://github.com/openzipkin/zipkin 这个是twitter开源出来的,也是参考Dapper的体系来做的。
Zipkin的java应用端是通过一个叫Brave的组件来实现对应用内部的性能分析数据采集。
Brave的github地址:https://github.com/openzipkin/brave
这个组件通过实现一系列的java拦截器,来做到对http/servlet请求、数据库访问的调用过程跟踪。
然后通过在spring之类的配置文件里加入这些拦截器,完成对java应用的性能数据采集。
3、CAT
github地址:https://github.com/dianping/cat 这个是大众点评开源出来的,实现的功能也还是蛮丰富的,国内也有一些公司在用了。
不过他实现跟踪的手段,是要在代码里硬编码写一些“埋点”,也就是侵入式的。
这样做有利有弊,好处是可以在自己需要的地方加埋点,比较有针对性;坏处是必须改动现有系统,很多开发团队不愿意。
4、SkyWalking
github地址:https://github.com/apache/incubator-skywalking 这也是一个对JAVA分布式应用程序集群的业务运行情况进行追踪、告警和分析的系统。
5、Xhprof/Xhgui
这两个工具的组合,是针对PHP应用提供APM能力的工具,也是非侵入式的。
Xhprof github地址:https://github.com/preinheimer/xhprof Xhgui github地址:https://github.com/perftools/xhgui
参考:https://www.zhihu.com/question/27994350