InfluxDB介绍
InfluxDB用Go语言编写的一个开源分布式时序、事件和指标数据库,和传统是数据库相比有不少不同的地方。
类似的数据库有Elasticsearch、Graphite等。
特点
- 提供了Http接口的API来操作数据
- 提供了类似sql的数据库语句
- 其它...
用途
一般用来储存实时数据,配合一套UI界面来展示信息。
安装使用
下载地址
直接官网下载就好,非常简单。
https://influxdata.com/downloads/#influxdb
安装
sudo dpkg -i influxdbName.deb
启动
sudo service influxdb start
使用
启动成功之后,我们就可以开始使用influxDB啦!
命令行
在命令行中直接输入influx,就可以管理数据库了。
root@xtutu:~# influx
Visit https://enterprise.influxdata.com to register for updates, InfluxDB server management, and monitoring.
Connected to http://localhost:8086 version 0.10.0
InfluxDB shell 0.10.0
> show databases
name: databases
---------------
name
_internal
mydb
使用web页面来操作
在浏览器中输入localhost:8083
创建一个数据库
> CREATE DATABASE "testDB"
> show databases
name: databases
---------------
name
_internal
mydb
testDB
使用数据库
> use testDB
Using database testDB
现在我们就可以在这个数据库上进行各种操作了!
名词解释
在上一个章节中,已经建立了一个名为testDB的数据库。在之后的演示中,都将在这个数据库上操作。
在InfluxDB中有不少名词,初学者非常容易搞混,这一节主要就是对这些名词进行解释。
场景定义
我们有一个数据库名为testDB,里面有一张表weather用于记录:多个地区在几组海拔下的一天的温度变化,所以表中有以下字段:
- 时间 time
- 温度 temperature
- 湿度 humidity
- 地区 area
- 海拔 altitude
与传统数据库中的名词做比较
influxDB中的名词 | 传统数据库中的概念 |
database | 数据库 |
measurement | 数据库中的表 |
points | 表里面的一行数据 |
InfluxDB中独有的一些念概
Point由时间戳(time)、数据(field)、标签(tags)组成。
Point属性 | 传统数据库中的概念 |
time | 每个数据记录时间,是数据库中的主索引(会自动生成) |
fields | 各种记录值(没有索引的属性)也就是记录的值:温度, 湿度 |
tags | 各种有索引的属性:地区,海拔 |
这里不得不提另一个名词:series:
所有在数据库中的数据,都需要通过图表来展示,而这个series表示这个表里面的数据,可以在图表上画成几条线:通过tags排列组合算出来。
比如有如下数据:
> select* from weather
name: weather
-------------
time altitude area humidity temperature
1456386985094000000 1000 北 18 17
1456386985094000000 5000 上 20 47
1456386985094000000 5000 北 26 68
1456386985094000000 1000 广 17 83
1456387267668000000 1000 上 12 77
1456387267668000000 1000 北 16 20
1456387267668000000 5000 广 -3 66
1456387267668000000 5000 上 19 60
它的series为:
> show series from weather
name: weather
-------------
_key altitude area
weather,altitude=1000,area=北 1000 北
weather,altitude=5000,area=北 5000 北
weather,altitude=5000,area=上 5000 上
weather,altitude=1000,area=广 1000 广
weather,altitude=1000,area=上 1000 上
weather,altitude=5000,area=广 5000 广
基本操作
介绍InfluxDB中的一些基本操作,包括数据的增删改查、数据库与表的操作等。
增
我们看到在weather中的有不少数据。
本节将演示下如何为数据库插入数据。
通过命令行
use testDB
insert weather,altitude=1000,area=北 temperature=11,humidity=-4
这样,我们就向数据库中添加了一条数据。
通过Http接口
InfluxDB提供了Http的API接口,所以我们也可以通过下面的方式来插入数据。
curl -i -XPOST 'http://localhost:8086/write?db=testDB' --data-binary 'weather,altitude=1000,area=北 temperature=11,humidity=-4'
Line Protocol格式
插入数据的格式似乎比较奇怪,这是因为influxDB储存数据所采用的是Line Protocol格式。
在上面两个插入数据的方法中,都有一样的部分。
weather,altitude=1000,area=北 temperature=11,humidity=-4
其中:
- weather : 表名
- altitude=1000,area=北 : tag
- temperature=11,humidity=-4 :field
具体的格式介绍可以看官方的文档
删与改
在InfluxDB中并没有提供数据的删除与修改方法。
不过我们可以通过数据保存策略(Retention Policies)来实现删除。
具体请看:数据保存策略(Retention Policies)这一节。
查
本节将演示下查询数据的一些常用方法。
通过命令行
use testDB
# 查询最新的三条数据
SELECT * FROM weather ORDER BY time DESC LIMIT 3
通过Http接口
curl -G 'http://localhost:8086/query?pretty=true' --data-urlencode "db=testDB" --data-urlencode "q=SELECT * FROM weather ORDER BY time DESC LIMIT 3"
InfluxDB是支持类SQL语句的,具体的查询语法都差不多,就不再详细描述了。
详细见 官方https://docs.influxdata.com/influxdb/v1.0/query_language/data_exploration/
数据库与表的操作
以下语句都可以直接在InfluxDB的Web管理界面中调用
# 创建数据库
CREATE DATABASE "db_name"
# 显示所有数据库
SHOW DATABASES
# 删除数据库
DROP DATABASE "db_name"
# 使用数据库
USE mydb
# 显示该数据库中的表
SHOW MEASUREMENTS
# 创建表
# 直接在插入数据的时候指定表名(weather就是表名)
insert weather,altitude=1000,area=北 temperature=11,humidity=-4
# 删除表
DROP MEASUREMENT "measurementName"
数据保存策略(Retention Policies)
InfluxDB没有提供直接删除Points的方法,但是它提供了Retention Policies。
主要用于指定数据的保留时间:当数据超过了指定的时间之后,就会被删除。
查看当前数据库的Retention Policies
SHOW RETENTION POLICIES ON "testDB"
创建新的Retention Policies
CREATE RETENTION POLICY "rp_name" ON "db_name" DURATION 30d REPLICATION 1 DEFAULT
其中:
- rp_name:策略名
- db_name:具体的数据库名
- 30d:保存30天,30天之前的数据将被删除
它具有各种时间参数,比如:h(小时),w(星期) - REPLICATION 1:副本个数,这里填1就可以了
- DEFAULT 设为默认的策略
修改Retention Policies
ALTER RETENTION POLICY "rp_name" ON db_name" DURATION 3w DEFAULT
删除Retention Policies
DROP RETENTION POLICY "rp_name"
具体效果,大家可以直接自己在测试数据库上试验
连续查询(Continuous Queries)
当数据超过保存策略里指定的时间之后,就会被删除。
如果我们不想完全删除掉,比如做一个数据统计采样:把原先每秒的数据,存为每小时的数据,让数据占用的空间大大减少(以降低精度为代价)。
这就需要InfluxDB提供的:连续查询(Continuous Queries)。
当前数据库的Continuous Queries
# 这条命令得在命令行下输入,在web管理界面不能显示。
SHOW CONTINUOUS QUERIES
创建新的Continuous Queries
> CREATE CONTINUOUS QUERY cq_30m ON testDB BEGIN SELECT mean(temperature) INTO testDB."one_month".weather30m FROM weather GROUP BY time(30m) END
案例测试
创建rp(不为默认)
> CREATE RETENTION POLICY "three_month" ON "owl" DURATION 90d REPLICATION 1
创建cq e2e
> CREATE CONTINUOUS QUERY e2e_sec_5m ON owl RESAMPLE EVERY 5m FOR 5m BEGIN SELECT mean(suc_ratio), mean(suc_agent), mean(avg_conn_time) INTO owl."three_month".owl_tcp_e2e_area_isp_ip_sec FROM owl_tcp_e2e_area_isp_ip_sec GROUP BY time(5m), area, isp, idc, sec, probe_type END
c2p
> CREATE CONTINUOUS QUERY c2p_1m ON owl RESAMPLE EVERY 1m FOR 1m BEGIN SELECT mean(suc_ratio), mean(suc_agent), mean(avg_conn_time) INTO owl."three_month".owl_tcp_c2p_ip_isp_node FROM owl_tcp_c2p_ip_isp_node GROUP BY time(1m),bindAddr, endpoint_name, idc,isp, pisp,pnode_name,port,probe_type,remark,vip END
e2i
> CREATE CONTINUOUS QUERY e2i_1m ON owl RESAMPLE EVERY 1m FOR 1m BEGIN SELECT mean(suc_ratio), mean(suc_agent), mean(avg_conn_time) INTO owl."three_month".owl_tcp_e2i_ip_isp_idc FROM owl_tcp_e2i_ip_isp_idc GROUP BY time(1m),hostname, idc,isp,port,probe_type,status,vip END
RESAMPLE介绍
一、连续查询语法
连续查询的语法如下:
CREATE CONTINUOUS QUERY <cq_name> ON <database_name> [RESAMPLE [EVERY <interval>] [FOR <interval>]] BEGIN SELECT <function>(<stuff>)[,<function>(<stuff>)] INTO <different_measurement> FROM <current_measurement> [WHERE <stuff>] GROUP BY time(<interval>)[,<stuff>] END
其中,基本的用法在那篇文章中已经讲到了,本文主要为大家介绍下它的一些高级特性。
二、指定连续查询的时间范围
可以使用RESAMPLE FOR 关键词来指定连续查询的时间范围,比如,每次执行都对1小时内的数据进行连续查询:
> CREATE CONTINUOUS QUERY vampires_1 ON transylvania RESAMPLE FOR 60m BEGIN SELECT count(dracula) INTO vampire_populations_1 FROM raw_vampires GROUP BY time(30m) END
这个语句每次会将1小时的数据执行连续查询,也就是说,每次执行时,会将now()到now()-30m和now()-30m到now()-60m分别做连续查询,这样我们就可以手动指定连续查询的时间范围了。
三、指定连续查询的执行频次
可以使用RESAMPLE EVERY 关键词来指定连续查询的执行频次,比如,指定连续查询的执行频次为每15m执行一次:
> CREATE CONTINUOUS QUERY vampires ON transylvania RESAMPLE EVERY 15m BEGIN SELECT count(dracula) INTO vampire_populations FROM raw_vampires GROUP BY time(30m) END
这样,连续查询会每隔15m执行一次。
四、同时指定连续查询的范围和频次
将RESAMPLE FOR 和 EVERY关键词同时使用,可以同时指定连续查询的范围和频次,如下:
> CREATE CONTINUOUS QUERY vampires_2 ON transylvania RESAMPLE EVERY 15m FOR 60m BEGIN SELECT count(dracula) INTO vampire_populations_2 FROM raw_vampires GROUP BY time(30m) END
这个语句指定连续查询每15m执行一次,每次执行的范围为60m。
其中:
- cq_30m:连续查询的名字
- testDB:具体的数据库名
- mean(temperature): 算平均温度
- weather: 当前表名
- weather30m: 存新数据的表名 可加库 保留策略
- 30m:时间间隔为30分钟
当我们插入新数据之后,可以发现数据库中多了一张名为weather30m(里面已经存着计算好的数据了)。这一切都是通过Continuous Queries自动完成的。
> SHOW MEASUREMENTS
name: measurements
------------------
name
weather
weather30m
删除Continuous Queries
DROP CONTINUOUS QUERY <cq_name> ON <database_name>
具体效果,大家可以直接自己在测试数据库上试验 官方文档 https://docs.influxdata.com/influxdb/v1.0/query_language/spec/#create-continuous-query
用户管理
以下语句都可以直接在InfluxDB的Web管理界面中调用
# 显示用户
SHOW USERS
# 创建用户
CREATE USER "username" WITH PASSWORD 'password'
# 创建管理员权限的用户
CREATE USER "username" WITH PASSWORD 'password' WITH ALL PRIVILEGES
# 删除用户
DROP USER "username"
第三方库API接口
InfluxDB提供了各种语言的Http API接口的封装。具体可以看这里:
https://docs.influxdata.com/influxdb/v0.10/clients/api/
同时,官方也提供了Telegraf插件来收集数据,除此之外还有collectd等比较常用的第三方数据收集工具。
我并不推荐一开始就用各种工具,这样会淡化对InfluxDB的理解。
当然,如果你本身对这些工具很熟悉,那么就直接使用吧!
https://github.com/influxdata/influxdb-python
$ python
>>> from influxdb import InfluxDBClient
>>> json_body = [
{
"measurement": "cpu_load_short",
"tags": {
"host": "server01",
"region": "us-west"
},
"time": "2009-11-10T23:00:00Z",
"fields": {
"value": 0.64
}
}
]
>>> client = InfluxDBClient('localhost', 8086, 'root', 'root', 'example')
>>> client.create_database('example')
>>> client.write_points(json_body)
>>> result = client.query('select value from cpu_load_short;')
>>> print("Result: {0}".format(result))
数据展示工具
数据最终是需要一套UI来展示的,而这种实时数据的展示,已经有不少项目了。 比如:
- 官方的Chronograf
- Grafana
- 其它...
Grafana简单使用
下载安装
Grafana也是用GO语言写的,无任何依赖,安装非常简单。
启动
sudo service grafana-server start
运行
直接访问:http://your_ip:3000
登入
默认帐号:admin
默认密码:admin
添加数据库
在Data Sources中添加数据库testDB
其中user和password,如果没有设置过,可以随便填下。
保存之后,可以通过Test Connection来测试,是否填写正确。
创建Dashboard
点击New按钮就可以了。
添加一个图形界面
为界面关联数据
- 选择testDB数据库
- 添加查询语句
- 完美显示!记得保存