CPU相关监控项

以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。监控项名称监控项含义单位说明

Host.cpu.idle当前空闲CPU百分比%

Host.cpu.system当前内核空间占用CPU百分比%指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程

Host.cpu.user当前用户空间占用CPU百分比%用户进程对CPU的消耗

Host.cpu.iowait当前等待IO操作的CPU百分比%该项数值比较高说明有很频繁的IO操作

Host.cpu.other其他占用CPU百分比%其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗

Host.cpu.total当前消耗的总CPU百分比%指以上各项CPU消耗的总和,通常用于报警

内存相关监控项

以下为内存相关监控项,可参考free命令来理解各项指标含义。监控项名称监控项含义单位说明

Host.mem.total内存总量bytes服务器的内存总量

Host.mem.used已用内存量bytes用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间

Host.mem.actualused用户实际使用的内存bytes计算方法为(used - buffers - cached)

Host.mem.free剩余内存量bytes计算方法为(内存总量-已用内存量)

Host.mem.freeutilization剩余内存百分比%计算方法为(剩余内存量/内存总量*100%)

Host.mem.usedutilization内存使用率%计算方法为( Actual used/total*100%)

系统平均负载监控项

以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。监控项名称监控项含义单位

Host.load1过去1分钟的系统平均负载,Windows操作系统没有此指标无

Host.load5过去5分钟的系统平均负载,Windows操作系统没有此指标无

Host.load15过去15分钟的系统平均负载,Windows操作系统没有此指标无

磁盘相关监控项

磁盘使用率与inode使用率可参考Linux df命令。磁盘读写指标可参考Linux iostat命令。监控项名称监控项含义单位

Host.diskusage.used磁盘的已用存储空间bytes

Host.disk.utilization磁盘使用率%

Host.diskusage.free磁盘的剩余存储空间bytes

Host.diskussage.total磁盘存储总量bytes

Host.disk.readbytes磁盘每秒读取的字节数bytes/s

Host.disk.writebytes磁盘每秒写入的字节数bytes/s

Host.disk.readiops磁盘每秒的读请求数量次/秒

Host.disk.writeiops磁盘每秒的写请求数量次/秒

文件系统监控项监控项名称监控项含义单位说明

Host.fs.inodeinode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标%inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高

网络相关监控项

以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:监控项名称监控项含义单位

Host.netin.rate网卡每秒接收的比特数,即网卡的上行带宽bits/s

Host.netout.rate网卡每秒发送的比特数,即网卡的下行带宽bits/s

Host.netin.packages网卡每秒接收的数据包数个/秒

Host.netout.packages网卡每秒发送的数据包数个/秒

Host.netin.errorpackage设备驱动器检测到的接收错误包的数量个/秒

Host.netout.errorpackages设备驱动器检测到的发送错误包的数量个/秒

Host.tcpconnection各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED个

进程相关监控项

进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。

Host.process.openfile 可参考Linux lsof命令。

Host.process.number 可参考Linux ps aux |grep ''关键字'' 命令。监控项名称监控项含义单位

Host.process.cpu某个进程消耗的CPU百分比%

Host.process.memory某个进程消耗的内存百分比%

Host.process.openfile当前进程打开文件数个

Host.process.number指定关键字的进程数个

ECS自带监控项

如果主机是ECS服务器,以下监控项为购买ECS后,不需要安装插件就可以提供的监控项。指标采集粒度为1分钟。监控项名称监控项含义单位

ECS.CPUUtilizationCPU使用率%

ECS.InternetInRate公网入流量平均速率bits/s

ECS.IntranetInRate私网入流量平均速率bits/s

ECS.InternetOutRate公网出流量平均速率bits/s

ECS.IntranetOutRate私网出流量平均速率bits/s

ECS.SystemDiskReadbps系统磁盘每秒读取字节总数Bytes/s

ECS.SystemDiskWritebps系统磁盘每秒写入字节总数Bytes/s

ECS.SystemDiskReadOps系统磁盘每秒读取次数个/秒

ECS.SystemDiskWriteOps系统磁盘每秒写入次数个/秒

ECS.InternetIn公网流入流量bytes

ECS.InternetOut公网流出流量bytes

ECS.IntranetIn内网流入流量bytes

ECS.IntranetOut内网流出流量bytes

站点监控项

站点监控支持8种协议的探测,主要用于模拟真实用户访问情况,探测 API 可用性、端口连通性、DNS 解析等问题。

探测协议说明:探测类型功能

HTTP对指定的URL/IP进行HTTP探测,获得可用性监控以及响应时间、状态码。高级设置中支持GET/POST/HEAD 请求方式、cookie、header信息、判断页面内容是否符合匹配内容。

PING对指定的URL/IP进行ICMP Ping探测,获得可用性监控以及响应时间、丢包率。

TCP对指定的端口进行TCP探测,获得可用性监控以及响应时间、状态码。高级设置中支持配置TCP的请求内容及匹配响应内容。

UDP对指定的端口进行UDP探测,获得可用性监控以及响应时间、状态码。高级设置中支持配置UDP的请求内容及匹配响应内容。

DNS对指定的域名进行DNS探测,获得可用性监控以及响应时间、状态码。高级设置中支持查询A/MX/NS/CNAME/TXT/ANY记录。

POP3对指定的URL/IP进行POP3探测,获得可用性监控以及响应时间、状态码。高级设置中支持端口、用户名、密码和是否使用安全链接的设置。

SMTP对指定的URL/IP进行SMTP探测,获得可用性监控以及响应时间、状态码。高级设置中支持端口、用户名、密码和是否使用安全链接的设置。

FTP对指定的URL/IP进行FTP探测,获得可用性监控以及响应时间、状态码。高级设置中支持端口、是否使用安全链接的设置。