RRDtool深入学习

介绍

RRDtool:Round Robin Database Tool(轮询的数据库工具)

    是一种存储数据的方式,使用固定大小的空间来存储数据,并有一个指针指向最新的数据的位置。我们可以把用于存储数据的数据库的空间看成一个圆,上面有很多刻度。这些刻度所在的位置就代表用于存储数据的地方。所谓指针,可以认为是从圆心指向这些刻度的一条直线。指针会随着数据的读写自动移动。要注意的是,这个圆没有起点和终点,所以指针可以一直移动,而不用担心到达终点后就无法前进的问题。在一段时间后,当所有的空间都存满了数据,就又从头开始存放。这样整个存储空间的大小就是一个固定的数值。所以RRDtool 就是使用类似的方式来存放数据的工具。


RRDtool的详细使用:

首先,我们需要知道数据库中的数据和我们获取的数据未必是一样的,有可能一样有可能不一样,直接获取的数据对于我们来说没什么意义。我们需要理解数据结构

RRDtool深度理解_使用

PDP(Primary Data Point):            主数据点

CDP(Consolidation Data Point):    聚合数据点

解析度(resolution):               指的就是时间跨度

DS(Data Source):                  数据源,每一个数据源都可以对其做单独的聚合


RRDtool常用命令

rrdtool <create|update|graph|info|fetch>
    create:    创建新的RRD数据库文件
    update:    更新新的数据到.rrd数据库里面去
    graph:     使用存储在.rrd数据库里面的一个或多个RRD生成一个图片
    info:      获取一个.rrd的结构信息
    fetch:     获取.rrd上数据信息

rrdtool create语法介绍

rrdtool create filename [--start|-b start time] [--step|-s step]
                        [DS:ds-name:DST:dst arguments]  
                        [RRA:CF:cf arguments]
filename:    默认为.rrd为后辍的文件,名称自己随意取;
--start:     指定RRDtool的第一个记录的起始时间,--start选项的值必须是timestamp的格式。
             如查你想自己设定时间可以使用--start $(date -d '1 days ago' +%s) ,当然还有一种方法就是使用rrdtool fetch filename.rrd AVERAGE;
--step:      就是RRDtool“期望”每隔多长时间就收到一个值;
DS:         用于定义数据源;
ds-name:     指定数据源的名字,随意取。必须是1到19个字符,且是a-z、A-Z、或者0-9;
DST:        定义源数据类型,源数据类型分以下几种:
                    1、COUNTER      数据必须是递增的,保存的是相对于前面的一个值
                    2、GUAGE        保存原值
                    3、DERIVE       可增可减
                    4、ABSOLUTE     相对于初始值的数值
                    5、COMPUTE      对于COMPUTE数据源来说格式是DS:ds-name:COMPUTE:rpn-expression
dst argument:数据源参数,形式是:    heartbeat:min:max
                 heartbeat:  定义在我们这个时间跨度之内,再过多长时间过期,过期的标记为unknown;
                 min:        接收的最小值,一般我们可以都设为0;
                 max:        接收的最大值,如果不是很清楚其最大值可以设置为U;
RRA:        用于指定数据如何存放;
CF:          指定数据合并方法,合并方法分以下几种:
                    1、average    平均值
                    2、max        最大值
                    3、min        最小值
                    4、last       当前值
cf arguments:数据保存,它的形式是:    xff:steps:rows
              xff:        定义PDP中出现unknown的百分比高于设置的这个比例以后CDP也被标记为unknown;
              steps:     聚合函数对多少个pdp做聚合生成cdp;
              rows:      保存多少个聚合的cdp结果;

rrdtool update语法介绍

rrdtool {update | updatev} filename [--template | -t ds-name[:ds-name]...]
[--] N | timestamp:value[:value...]
-t :    改变接收数据的次序
            例如,我们定义的rrdtool create test.rrd DS:ds1 DS:ds2,默认情况下我们想这个数据库里面输入值得话是:rrdtool update test.rrd N:30(DS1值):40(DS2值),
            使用rrdtool update test.rrd -t  ds2:ds1 40:30 把循序给颠倒; 
N:       表示当前时间

rrdtool info语法介绍

rrdtool info filename    用于查看filename的数据结构(filename就是rrdtool create生成的数据库文件);

rrdtool fetch语法介绍

rrdtool fetch filename [-r #] [CF]
-r #:    指定#个PDP为一个数据;
CF:      指定使用哪种合并函数,与rrdtool create中cf argument一样;

rrdtool graph语法介绍

rrdtool graph|graphv filename [option ...][datadefinition ...][data calculation ...][variabledefinition ...][graph element ...][print element ...]
[-s|--start time][-e|--end time][-S|--step seconds]
[-t|--title string][-V |--Vertical-label string ]
[-w|--width pixels][-h|--height pixels][-j|--only-graph][-D|--full-size-mode]

OPTION:
Graph Limits
[-u | --upper-limit value]:     显示数值的最大上限的值
[-l | --lower-limit value]:    显示的最低下限的值
[-r | --rigid ]:                不会自动缩放,以定义的最大值和最小值来显示
[-A | --alt-autoscale ]:        启用自动缩放,但是最大的和最小的是不能超过上面的范围
[-J | --alt-autoscale-min]:     只自动缩放最小值
[-M | --alt-autoscale-max ]:    只自动缩放最大值
[-N | --no-gridfit]:            不显示网格线

定义横轴:
X-Axis
    [-x|--x-grid GTM:GST(定义基准网格线,前面是单位,后面是数值)
    :MTM:MST(定义主网格线,前面的是单位,后面的是数值)
    :LTM:LST(定义横轴底面的标签的单位和距离,前面是单位,后面是距离)
    :LPR:LFM(显示标签的显示格式)]
    [-x | --x-grid none ]

Y-Axis
    [-y|--y-grid grid(刻度是什么) step(多长显示一个刻度)
    :label(卷标显示是什么) factor(卷标多长时间显示一个)]:
    [-y|--y-grid none ]
    [-Y| --alt-y-grid]

图片全局定义
   [-c| --color COLORTAGE #rrggbb[aa]]
       BACK          #背景色
       CANVAS        #画布颜色
       SHADEA        #左边和上边的颜色
       SHADEB        #右边和下边的颜色
       GRID,MGRID   #主网格线的颜色
       FONT          #字体颜色
       AXIS          #坐标轴的颜色
       FRAME         #边框颜色
       ARROW         #箭头的颜色
    -n | --font FONTTAG(字体名字):size(大小):[font(路径)]   #指定字体的参数
    [-R|--font-render-mode(字体格式) {normal(正常),light(发亮),mono(粗体)}]
    [-a|--imgformat PNG|SVG|EPS|PDF]   #图像输出格式
    [-W| --watermark string ]          #加水印

数据与变量
定义数据获取方式:
  DEF:vname(变量名,只能包含数字和字母,最长不能超过255字符)=rrdfile(rrd文件路径):ds-name(数据源名称):CF(聚合函数)[:step=step][:start=time][:end=time]
  CDEF:vname=RPN expression
  VDEF:vname=RPN expression

图片
线状图:
   LINE[width(线条的粗细程度,1最细的3是最粗的)
   :value(上面定义的变量名称)[#color(线条颜色)]
   [:[legend(底面的标签名称)][:STACK]]
   [:dashes[=on_s[,off_s[,on_s,off_s]...]
   [:dash-offset=offset]
面积图:
    AREA:value[#color][:[legend][:STACK]]


实例1:随机生成数据

1、创建一个hello.rrd数据库文件

# rrdtool create test.rrd --step 5 DS:testds:GAUGE:8:0:U RRA:AVERAGE:0.5:1:17280 RRA:AVERAGE:0.5:10:3456 RRA:AVERAGE:0.5:100:1210
# rrdtool info test.rrd 
filename = "test.rrd"
rrd_version = "0003"
step = 5
last_update = 1403544501
ds[testds].type = "GAUGE"
ds[testds].minimal_heartbeat = 8
ds[testds].min = 0.0000000000e+00
ds[testds].max = NaN
ds[testds].last_ds = "U"
ds[testds].value = 0.0000000000e+00
ds[testds].unknown_sec = 1
rra[0].cf = "AVERAGE"
rra[0].rows = 17280
rra[0].cur_row = 5294
rra[0].pdp_per_row = 1
rra[0].xff = 5.0000000000e-01
rra[0].cdp_prep[0].value = NaN
rra[0].cdp_prep[0].unknown_datapoints = 0
rra[1].cf = "AVERAGE"
rra[1].rows = 3456
rra[1].cur_row = 1634
rra[1].pdp_per_row = 10
rra[1].xff = 5.0000000000e-01
rra[1].cdp_prep[0].value = NaN
rra[1].cdp_prep[0].unknown_datapoints = 0
rra[2].cf = "AVERAGE"
rra[2].rows = 1210
rra[2].cur_row = 622
rra[2].pdp_per_row = 100
rra[2].xff = 5.0000000000e-01
rra[2].cdp_prep[0].value = NaN
rra[2].cdp_prep[0].unknown_datapoints = 0

2、写一个脚本random.sh,它能自动给hello.rrd中写入数据

# vim random.sh
#!/bin/bash
while true; do
    rrdtool update test1.rrd N:$RANDOM
    sleep 5
done
# bash -x random.sh

3、一段时间后,我们可以查看hello.rrd中的数据

# rrdtool fetch test.rrd AVERAGE -r 5    //这里我们使用每5s的解析度来显示,如果我们使用每10s呢?因为test.rrd中没有定义每10s的解析度,所以它自动会选择小于自定义的,且最靠近的解析度值显示
... ... ... ... ... ......
1403544585: -nan
1403544590: 2.0996768708e+03
1403544595: 1.6197283451e+04
1403544600: 1.1111383278e+04
1403544605: -nan

4、画图

1)单线条画法:

# rrdtool graph test1.png --step 5 -s 1403544590 -t TEST -v vtest DEF:vtest=test.rrd:testds:AVERAGE LINE1:vtest#FF0000:testline1
497x174

把文件复制到windows主机上查看一下吧:

RRDtool深度理解_原理_02

2)多线条画法:

# rrdtool graph test2.png -s 1403544590 -t TEST -v vtest DEF:vtest1=test.rrd:testds:AVERAGE:step=5 DEF:vtest2=test.rrd:testds:AVERAGE:step=50 LINE1:vtest1#FF0000:testline1 LINE1:vtest2#00FF00:testline2
497x174

RRDtool深度理解_原理_03


实例2:这里我们来记录mysql用户查询次数

# rrdtool create mysql.rrd --step 3 DS:myselect:COUNTER:5:0:U RRA:AVERAGE:0.5:1:28800 RRA:AVERAGE:0.5:10:2880 RRA:MAX:0.5:10:2880 RRA:LAST:0.5:10:2880
# vim mysql_select.sh
#!/bin/bash
while true ; do
    select=`mysql -e "show global status like 'com_select'" |awk '/Com_select/{print $2}'`
    rrdtool update mysql.rrd N:$select
    sleep 3
done
#由于数据产生太慢,我们再写一个脚本来增大数据量,实验效果更加明显:
# mysql
mysql> create database testdb;
mysql> use testdb;
mysql> create table tb1(id int not null auto_increment primary key,name varchar(50) not null);
mysql> quit
# vim insert.sh 
#!/bin/bash
for i in {1..20000}; do
    mysql -e "insert into testdb.tb1 (name) values(user$i)"
    mysql -e "select * from testdb.tb1" &>/dev/null
done
# bash -x mysql_select.sh
# bash -x insert.sh
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per" DEF:select3=mysql.rrd:myselect:AVERAGE:step=3 LINE1:select3#FF0000:"每3秒值"
497x174

RRDtool深度理解_rrdtool_04

我们再扩展一下:

多条线组合在一张图片上:
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per" DEF:select3=mysql.rrd:myselect:AVERAGE:step=3 DEF:select30=mysql.rrd:myselect:AVERAGE:step=30 LINE1:select3#FF0000:"每3秒值" LINE1:select30#00FF00:"每30秒值"

RRDtool深度理解_使用_05

为指定的线注明最大值
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per 3/s" DEF:select30=mysql.rrd:myselect:AVERAGE:step=30 DEF:max30=mysql.rrd:myselect:MAX:step=30 LINE1:select30#FF0000:"每30秒取值" GPRINT:max30:MAX:"最大值\:%6.2lf"

RRDtool深度理解_rrdtool_06