虽然前面介绍过一些Redis的数据结构,但在Redis中,真正的数据类型都是对象,Redis使用对象来表示数据库中的键和值,每次当我们在Redis的数据库中新创建一个键值对时,我们至少会创建两个对象,一个对象用作键值对的键(键对象),另一个对象用作键值对的值(值对象)。
Redis有五种对象, 分别是字符串对象、列表对象、哈希对象、集合对象和有序集合对象这五种类型的对象。每种对象都用到了至少一种我们前面所介绍的数据结构。Redis对象底层会在不同的情况下使用不同的数据结构,提高了Redis的灵活性和使用效率。
Redis的键都是字符串对象,Redis的值是以上五种对象之一。
Redis对象源码:
Redis中的每个对象都由一个redisObject结构表示,该结构中和保存数据有关的三个属性分别是type属性、encoding属性和ptr属性。
对象的type属性记录了对象的类型,这个属性的值可以是下表列出的常量的其中一个。
encoding属性记录了对象所使用的编码,也即是说这个对象使用了什么数据结构作为对象的底层实现,这个属性的值可以是下表列出的常量的其中一个。
对象的ptr指针指向对象的底层实现数据结构,而这些数据结构由对象的encoding属性决定。
字符串对象
字符串对象可以有三种编码方式:int、embstr、raw。
int:当字符串对象保存的是整数值,并且这个整数值可以用long类型来表示,那么字符串对象会将整数值保存在字符串对象结构的ptr属性里面(将void*转换成long),并将字符串对象的编码设置为int。
int编码的字符串对象
embstr:如果字符串对象保存的是一个字符串值,并且这个字符串值的长度小于等于32字节,那么字符串对象将使用embstr编码的方式来保存这个字符串值。
embstr编码的字符串对象
raw:如果字符串对象保存的是一个字符串值,并且这个字符串值的长度大于32字节,那么字符串对象将使用一个简单动态字符串(SDS)来保存这个字符串值,并将对象的编码设置为raw。
raw编码的字符串对象
embstr编码是专门用于保存短字符串的一种优化编码方式,这种编码和raw编码一样,都使用redisObject结构和sdshdr结构来表示字符串对象,但raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构。 embstr编码比raw编码有如下好处:
1.embstr编码将创建字符串对象所需的内存分配次数从raw编码的两次降低为一次。
2.释放embstr编码的字符串对象只需要调用一次内存释放函数,而释放raw编码的字符串对象需要调用两次内存释放函数。
3.因为embstr编码的字符串对象的所有数据都保存在一块连续的内存里面,所以这种编码的字符串对象比起raw编码的字符串对象能够更好地利用缓存带来的优势。
编码转换:int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下,会被转换为raw编码的字符串对象。
列表对象
列表对象有两种编码方式:ziplist、linkedlist。
ziplist:当列表对象保存的所有字符串元素数量小于512个并且元素的长度都小于64字节,列表使用ziplist编码。ziplist编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点(entry)保存了一个列表元素。
ziplist编码的numbers列表对象
linkedlist:当列表对象保存的所有字符串元素数量大于512个或者元素的长度大于64字节,列表使用linkedlist编码。linkedlist编码的列表对象使用双端链表作为底层实现,每个双端链表节点(node)都保存了一个字符串对象,而每个字符串对象都保存了一个列表元素。
linkedlist编码的列表对象
注意:编码的两个条件上限值是可以修改的。
哈希对象
哈希对象有两种编码方式:ziplist、hashtable。
ziplist:当哈希对象保存的所有字符串元素数量小于512个并且元素的长度都小于64字节,使用ziplist编码。
ziplist编码的哈希对象
哈希对象里的压缩列表
hashtable:当列表对象保存的所有字符串元素数量大于512个或者元素的长度大于64字节,使用hashtable编码。hashtable编码的哈希对象使用字典作为底层实现,哈希对象中的每个键值对都使用一个字典键值对来保存。字典的每个键和值都是一个字符串对象。
hashtable编码的哈希对象
注意:编码的两个条件上限值是可以修改的。
集合对象
集合对象的编码方式有:intset、hashtable。
intset:当集合对象保存的所有元素都是整数值并且数量不超过512个,使用intset编码。
intset编码的集合对象
hashtable:当集合对象保存的元素不是整数值或者数量超过512个,使用hashtable编码。hashtable编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值则全部被设置为NULL。
hashtable编码的集合对象
注意:编码的数量条件上限值是可以修改的。
有序集合对象
有序集合对象的编码方式有:ziplist、skiplist。
ziplist:当有序集合保存的所有元素成员长度小于64字节并且元素数量小于128个,使用ziplist编码。
ziplist编码的有序集合对象
有序集合对象里的压缩列表
skiplist:当有序集合保存的元素成员长度大于64字节或者元素数量大于128个,使用shiplist编码。有序集合对象里的跳跃表按分值从小到大保存了所有集合元素,每个跳跃表节点都保存了一个集合元素:跳跃表节点的object属性保存了元素的成员,而跳跃表节点的score属性则保存了元素的分值。除此之外,有序集合还创建一个字典,用于成员和分值的映射,字典中的每个键值对都保存了一个集合元素:字典的键保存了元素的成员,而字典的值则保存了元素的分值。通过这个字典,程序可以用O(1)复杂度查找给定成员的分值。
shiplist编码的有序集合
有序集合里的跳跃表和字典
注意:为了展示方便,上图在字典和跳跃表中重复展示了各个元素的成员和分值,但在实际中,字典和跳跃表会通过指针共享元素的成员和分值,所以并不会造成任何数据重复,也不会因此而浪费任何内存。