Thanos[1] 和 VictoriaMetrics[2] 都是用来作为 Prometheus 长期存储
Thanos[1] 和 VictoriaMetrics[2] 都是用来作为 Prometheus 长期存储的成熟方案,其中 VictoriaMetrics 也开源了其集群版本[3],功能更加强大。这两种解决方案都提供了以下功能: 长期存储,可以保留任意时间的监控数据。 对多个 Prometheus
容器-promQL语法之内存指标 在容器内进行内存监控的常用指标
简介 VictoriaMetrics集群方案,除了有单节点方案的优点以外,还可以做到水平扩容,当有大量数据存储时,VictoriaMetrics集群方案是个不错的选择。 官方建议是100w/s以下的数据点抓取,使用单节点版,单节点版可以省更多的CPU、内存、磁盘资源。 但是,当遇到如下问题可以考虑集
openfalcon 规划 拓扑图 transfer 配置文件 judge配置文件 graph配置文件 alarm配置文件 dashboard配置文件 fe 配置文件 hbs配置文件 sender配置文件 mail_provider配置文件, sender通过mail_provider发送邮件 no
1. linux客户端部署agent 2. 编写脚本,比如: #!/usr/bin/env python #!-*- coding:utf8 -*- import requests import time import json import random import os while True: time.sleep(20) payload_list = [] ...
open falcon dashboard 安装
触发graph的索引全量更新、补救手工操作带来的异常。触发方式为,运行curl -s "http://$hostname:$port/index/updateAll",其中$hostname为graph所在的服务器地址,$port为graph的http监听端口。这种方式,不会删除已上报的监控数据,但
info.py [{"endpoint":"master","counter":"feng-count","consolFun":"GAUGE","step":60,"filename":"/data/6070/c0/c0c426be18bf40971d0f2b6cc4331818_GAUGE_60
mongodb_server.py monodb_monitor.py
172.16.230.191 包含了 alarm send mail_provider nodata task aggregator agent chat sender配置文件,和0.1 相同 mail_provider 发送邮件功能,和0.1 相同 nodata 用于检查未上报的报警,比如agen
邮件测试[root@openfalcon_alarm_sender sender]# curl http://172.16.230.191:4000/sender/mail -d "tos=FengJian&subject=xx&content=yy" 微信测试[root@openfalcon_al
夜莺监控+prometheus
skywalking cluster: selector: ${SW_CLUSTER:standalone} standalone: # Please check your ZooKeeper is 3.5+, However, it is also compatible with ZooKeepe
夜莺 上传 数据 curl --location --request POST 'http://192.168.10.121:82/api/transfer/data' \ --header 'Content-Type: application/json' \ --data '[ { "end":
nodatas 设置agent 状态,其采集指标 agent.alive 上报中断时,通知用户。 hostgroups设置 模版设置
skywalking 是一个可观测分析平台(OAP) 和 应用性能管理系统(APM) 提供分布式链路追踪, 服务网格 遥测分析, 度量(metric) 聚合和可视化一体化解决方案. skywalking 几大特点: 多语言自动探针, java ,net core 和 node.js 多种监控手段,
1. Linux运维基础采集项 做运维,不怕出问题,怕的是出了问题,抓不到现场,两眼摸黑。所以,依靠强大的监控系统,收集尽可能多的指标,意义重大。但哪些指标才是有意义的呢,本着从实践中来的思想,各位工程师在长期摸爬滚打中总结出来的经验最有价值。 在各位运维工程师长期的工作实践中,我们总结了在系统运维
n9e 监控系统 需要连接 job ams transfer ,在不同的IDC机房 可以采用 rinetd 或者 rein 转发端口 我没测试过。。。。。。。
#!/bin/env python #-*- coding:utf-8 -*- import json import time import socket import os import re import sys import commands import urllib2, base64 import requests class RedisStats: redis_cli =...
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号