时间序列数据库(TSDB)是针对时间戳或时间序列数据优化的数据库。时间序列就是跟踪、监视、缩减采样和随时间聚合的测量或事件,可能是服务器指标,应用程序性能监控,网络数据,传感器数据,事件,点击,市场交易以及许多其他类型的分析数据。与来自常规数据不同,时间序列数据总是会和时间绑定在一起。

时间序列数据库是专门用于处理时间戳的度量标准和事件、测量。TSDB针对测量随时间的变化进行了优化。时间序列数据与其他数据非常不同的属性是数据生命周期管理、汇总和大量记录的大范围扫描。

为什么时间序列数据库现在很重要?

时间序列数据库并不是什么新鲜事物,但是第一代时间序列数据库主要集中在查看财务数据,股票交易的波动以及为解决交易而构建的系统。十年过去了,计算的基本条件也发生了根本变化,单片主机消失了,取而代之的是无服务器、微服务和容器。

如今,可以组成组件的一切,自身也是一个组件,目前我们在物质世界所见之处:街道、汽车、工厂、卫星、服装、电话、微波炉、牛奶容器、行星、人体各种可用表面的仪器等等,一切的一切在未来都将有传感器。当然这也意味着底层平台可能需要新的扩展和发展来支持新的工作负载,更多的数据点、更多的数据源、更多的监控和更多的控制。

我们目睹了时代的新需求,所以在如何处理数据基础架构以及如何构建、监控、控制和管理系统方面需要作出一些转变,我们需要更现代的TSDB。

如何区分时间序列工作?

时间序列数据库具有关键的架构设计属性,这就和其他数据库非常不同,其中包括:时间戳、数据存储和压缩、数据生命周期管理、数据汇总、处理大量记录的时间序列相关扫描的能力以及时间序列感知查询。

例如: 对于时间序列数据库,通常要求在很长一段时间内对数据进行汇总。这需要通过一系列的数据点来执行计算,例如在过去六个月的同一时期内,按照本月的百分比增加一个百分点,按月总结。用分布式键值存储这种工作量是非常难以优化的。TSDB针对这个用例进行了优化,给出了数月的毫秒级查询时间。

另一个例子: 时间序列数据库通常要在短时间内保持高精度的数据。这些数据被汇总并下采样成长期趋势数据。这意味着对于进入数据库的每个数据点,在其时间段结束之后,它将不得不被删除。这种数据生命周期管理对于应用程序开发人员来说很难在常规数据库上实现,而使用时间序列数据库可以立即提供此功能。