前言:
node_exporter用于监控*nux系统,使用go编写的收集器
prometheus服务器:192.168.199.222
监控服务器 192.168.199.221
在192.168.199.221下载node_exporter
wget https://github.com/prometheus/node_exporter/releases/download/v*/node_exporter-*.*-amd64.tar.gz tar xvfz node_exporter-*.*-amd64.tar.gz cd node_exporter-*.*-amd64 ./node_exporter
起来后node_exporter会监控在9100端口,
可通过curl http://localhost:9100/metrics 或者浏览器输入http://192.168.199.221:9100/metrics查看收集到的数据指标
使用文件服务发现的模式监控node_exporter,prometheus.yml添加配置如下(scrape_configs块下添加):
- job_name: 'node' file_sd_configs: - files: ['/usr/local/prometheus/sd_config/node.yml'] refresh_interval: 5s
添加/usr/local/prometheus/sd_config/node.yml文件如下:
- targets: - 192.168.199.221:9100
来看prometheus ui
使用promql
监控192.168.199.221服务器cpu 5分钟内的平均利用率
100-irate(node_cpu_seconds_total{job="node",mode="idle"}[5m])*100
内存使用率
100-(node_memory_MemFree_bytes+node_memory_Cached_bytes+node_memory_Buffers_bytes)/node_memory_MemTotal_bytes*100
磁盘使用率
100-node_filesystem_free_bytes{mountpoint="/"}/node_filesystem_size_bytes{mountpoint="/"}*100
修改node_exporter启动命令,监控linux服务器的运行状态
nohup ./node_exporter --collector.systemd --collector.systemd.unit-whitelist=(docker|sshd).service &
启动后promql中会有node_systemd_unit_state。如图