Data Model(数据模型)
Aerospike采用无模式(schema-less)数据模型,这意味着存储在库中的数据不符合严格模式。
这提供了你在Aerospike中存储数据的灵活性-数据修改不需要修改schema,库中已存在的数据也不需要符合指定的schema
Aerospike的无模式(schema-less)数据模型允许动态添加新类型的bin。尽管如此,仍然需要遵守bin名称与数据的对应关系。应用程序必须利用bin的一致性来保障查询和聚合的正确性。
How Data is Organized(数据如何组织)
Storage architecture
Namespaces(命名空间)
命名空间(namespace)是数据最顶层的容器。就像在标准的RDBMS中一样,namespace可以是数据库的一部分也可以是一组数据库,这决定于你如何存储和管理namespace中的数据。
一个namespace包含记录(records),索引(indexes )及策略(policies)。策略决定namespace的行为,包括:
- 数据如何存储:存储于内存或是磁盘
- 一条记录存在多少个副本
- 记录何时过期
更多关于namespace配置的信息请参看Configuring Namespaces。
根据应用程序的需要,一个数据库可能包含多个不同策略的多个namespace。namespace被认为是一个物理容器,因为其中的数据必须绑定存储设备,存储设备可能是内存、磁盘或者是文件。
图1中,我们定义了两个namespace分别命名为ns1和
ns2。ns1将记录存放在磁盘上,ns2将记录存放在内存中。
图1
定义两个namespace,它们使用不同的存储引擎
Sets(集合)
在命名空间(namespace)中,记录可以属于一个称作集合(set)的逻辑容器。集合(set)为应用程序提供了收集记录组的能力。集合(set)继承了包含它的namespace的策略,也可为set指定其他的策略。
图2中,为ns1 namespace添加两个集合,people和places。用于存储基于类型的记录。除了存储于两个集合中的记录,namespace中有部分记录不属于任何set。
图2
namspace ns1中定义两个set,People和Place。ns1中也包含不属于任何set的记录
Records(记录)
Aerospike数据库是行存储的所以焦点是独立的记录(在标准RDBMS中称作行)。记录是数据库存储的基本单元。行属于某个namespace或者某个namespace中的set。记录通过namespace中定义的唯一key来访问。
记录的组成如下:
组成 | 描述 |
key | 记录是通过一个哈希键进行访问的,称作摘要 |
metadata | 元数据提供记录的版本信息(代)以及活动时间(ttl) |
bins (fields) | bin相当于传统数据中的字段 |
Key / Digest
应用程序中,每一条记录都有一个用来访问它的key。应用程序通过key来读写记录。
当key被发送至数据库,key(与set信息一起)被哈希化成一个160位的摘要。数据库中,摘要为所有操作定位记录。
key主要用于应用程序访问,而摘要主要用于数据库定位记录。
key可能是整型,字符串或者二进制。细节请参阅Data Types.
Metadata(元数据)
每条记录与描述它自身的元数据一块存储,包括下列事物:
- generation(代)反映记录被修改的次数。这个数字在应用程序读的时候交回,用来确定正在写入的数据从最后一次读开始未被修改过。
- 存活时间 (TTL) 用来指定记录生存多长时间。Aerospike会自动依据记录的TTL使其过期。每次在对象上执行写操作TTL就会增加
Bins
在记录(record)中数据被存储于一个或多个bin。一个bin有名字和值组成。bin不指定类型,类型由bin中包含的值定义。
动态类型为数据模型提供了很大的弹性。例如,一条记录中包含值为字符串"bob"名称为 "id"的bin。bin的值可以变成不同的字符串值,也可以变为其他类型的值,比如整型的72.
namespace或set中的记录可能由迥然不同的bin的集合组成。记录无模式,所以每条记录拥有完全不同的bins是有可能的。在记录的生命周期中的任何时点都可以添加或移除bin
在一个namespace钟bin名称的数量是有限制的。最多32k个唯一bin名称。
bin的值可能是任意原生支持的类型(native supported types)和LDTs.
来源: <http://www.aerospike.com/docs/architecture/data-model.html>
译者:北京IT爷们儿