你好,欢迎收听极客视点。

你是否曾经遇到过一台服务器运行缓慢,但是 CPU 使用率看起来不是很高的情况?你是否遇到过服务器的网络利用率很高,但是定位不到导致高网络利用率的进程情况?泰特·加尔布雷思(Tate Galbraith)介绍了一些工具可以帮助你快速准确地诊断和定位问题,许多工具都可以在没有 GUI 的情况下使用,并且能轻松安装在大多数服务器上。以下为InfoQ的翻译内容。

1. iotop

如果你想知道到底哪些进程消耗了服务器宝贵的 I/O 资源,那么你可以使用 iotop,通过 IOPS 参数来定位那些占用磁盘 IO 的耗时进程。

你可以将 iotop用于多种目的,但最关键的是查看磁盘使用情况并标记潜在的性能瓶颈。将此工具与 top 或 htop 等其他工具结合使用,能帮你更全面地了解服务器当前负载情况。

另外,不建议将 iotop 用于基准测试,尽管你可以清楚地了解每个进程占用多少 I/O 资源,但它更适合实时监控而不是重复的性能测试。如果你对 I/O 基准测试感兴趣,可以试试 Fio 这个工具。

2. htop

该工具比 top 工具更具视觉吸引力,并且拥有出色的默认配色方案。使用它,你就可以马上对系统当前的运行情况有一个清晰的了解。

你能清晰地在水平条形图中查看计算机内核数目以及它们的利用率,同样地,你还可以获得内存使用情况的简单统计信息,并且在底部也有经典的 top 进程列表。

如果你肯定某个进程正在耗尽系统上的所有核心从而打开 htop 进行查看,那么就会发现大片红色,整个过程快速而简单。

3. IPTraf

这是一个诊断网络问题非常有用的工具。使用此工具,你可以监控正在网络传输的网络流量。也能以特定的接口或流量类型(例如特定的TCP 端口)进行过滤。它与 Wireshark 功能非常相似,不同之处在于它更轻巧,并且也可以在没有 GUI 的情况下运行。

另外,该监控工具还有一些非常棒的功能,比如按数据包大小对流量进行统计细分。

4. Monit

这是你可以在 Linux 上使用的最灵活、功能最强大的监视工具之一。 Monit 出现了很多年,它能通过多种方式进行配置以支持不同类型的阈值监控和性能告警。

Monit 允许你指定要在 Linux 操作系统上监视的进程、端口、文件等。它支持使用复杂的回退计时器 back-off timer 和消息来设置动态警报模式。

一个监控场景比如你想监控特定进程以确保其正在运行,如果该进程崩溃一次,只需重新启动它即可。如果它开始多次连续的崩溃,那就不要重新启动该进程,而应该发送警报。这样的监控场景可以通过 Monit 的几行配置轻松实现。

Monit 甚至为守护程序提供了一个不错的轻量级 Web 界面,让你一眼就能看到服务器发生了什么。无论你是管理单个服务器还是集群,Monit 提供了最简单,最高效和最划算的(免费)方法来帮你监控服务的运行状态。

以上就是加尔布雷思推荐的 4 个Linux监控工具,希望对你有所帮助。