目录
- NoSQL:一类新出现的数据库(not only sql)
- 特征
- NoSQL和SQL数据库的比较:
- 电商场景解决方案
- Redis简介
- Redis特性
- Redis 优势
- Redis应用场景
- 官方文档
- 业务数据的特殊性
- 作为缓存使用
- 附加功能
- Redis 数据类型
- 1.string
- 增加
- 获取
- 删除
- string 类型数据的业务场景
- 业务场景 1
- 解决方案
- 业务场景2
- 解决方案
- 业务场景3
- 解决方案
- 2. key 的操作
- 3. hash类型
- 增加
- 查询
- 删除
- 更新
- hash 类型数据操作的注意事项
- hash类型应用场景
- 业务分析
- 解决方案
- 解决方案
- 4. list 列表
- 增加
- 获取
- 修改(更新)
- 删除
- list 类型应用场景
- 5.set类型
- 增加
- 获取
- 删除
- set应用场景
- 6. zset类型(有序集合)
- 增加
- 获取
- 删除
- 报错解决方案
- redis综合实践
- 大总结
NoSQL:一类新出现的数据库(not only sql)
- 泛指非关系型的数据库,作为关系型数据库的补充。
- 不支持SQL语法
- 存储结构跟传统关系型数据库中的那种关系表完全不同,nosql中存储的数据都是key :value 形式
- SQL的世界中没有一种通用的语言,每种nosql数据库都有自己的api和语法,以及擅长的业务场景
- NoSQL中的产品种类相当多:
Mongodb
Redis
memcache
Hbase hadoop
Cassandra hadoop - 作用: 应对基于海量用户和海量数据高并发处理问题
特征
- 可扩容,可伸缩
- 大数据量下高性能
- 灵活的数据模型
- 高可用
NoSQL和SQL数据库的比较:
- 适用场景不同:sql数据库适合用于关系特别复杂的数据查询场景,nosql反之
- “事务”特性的支持:sql对事务的支持非常完善,而nosql基本不支持事务
- 两者在不断地取长补短,呈现融合趋势
电商场景解决方案
Redis简介
- Redis(Remote Dictionary Server)是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由VMware主持。从2013年5月开始,Redis的开发由Pivotal赞助。
- Redis是 NoSQL技术阵营中的一员,它通过多种键值数据类型来适应不同场景下的存储需求,借助一些高层级的接口使用其可以胜任,如缓存、队列系统的不同角色
Redis特性
Redis 与其他 key - value 缓存产品有以下几个特点:
- Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可 以再次加载进行使用。
- Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存储。
- Redis支持数据的备份,即master-slave模式的数据备份。
- reids内部采用单线程工作
Redis 优势
- 性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。
- 丰富的数据类型 – Redis支持二进制案例的 Strings, Lists, Hashes, Sets 及 Ordered Sets 数据类型操作。
- 原子 – Redis的所有操作都是原子性的,同时Redis还支持对几个操作全并后的原子性执行。
- 丰富的特性 – Redis还支持 publish/subscribe, 通知, key 过期等等特性。
Redis应用场景
- 用来做缓存(ehcache/memcached)——redis的所有数据是放在内存中的(内存数据库)
- 可以在某些特定应用场景下替代传统数据库——比如社交类的应用
- 时效性信息控制,如session共享、购物车、验证码缓存、登录session缓存、股票控制等。
- 为热点数据加速查询(主要场景),如热点商品,热点新闻、热点资讯、推广类等高访问量信息。
- 任务队列,如秒杀、抢购、购票排队等。
- 即时信息查询,如各类排行榜、各类网站访问统计、公交到站、即时点赞评论数量、在线人数信息(聊天室、网站)设备信号等。
- 分布式数据共享,如分布式集群架构的session共享。
- 消息队列
- 分布式锁
官方文档
业务数据的特殊性
作为缓存使用
- 原始业务功能设计
- 秒杀
- 618活动
- 双11活动
- 12306排队购票系统
- 运营平台监控到的突发高频访问数据
- 突发时政要闻、突发重大灾害要闻、明星绯闻……
- 高频、复杂的统计数据
- 在线人数
- 投票排行榜
附加功能
- 系统功能优化或升级
- 单服务器升级集群
- session管理
- token管理
Redis 数据类型
- 字符串string
- 哈希hash
- 列表list
- 集合set
- 有序集合zset
redis自身是一个Map,所有数据都是key:value
1.string
字符串类型是 Redis 中最为基础的数据存储类型,它在 Redis 中是二进制安全的,这便意味着该类型可以接受任何格式的数据,如JPEG图像数据或Json对象描述信息等。在Redis中字符串类型的Value最多可以容纳的数据长度是512M。
增加
- 设置键值如果设置的键不存在则为添加,如果设置的键已经存在则修改.
set key value
10.23.117.188:6379> select 0
OK
10.23.117.188:6379> set name laowang
OK
10.23.117.188:6379>
10.23.117.188:6379> get name
"laowang"
10.23.117.188:6379>
- 设置键值及过期时间,以秒为单位
setex key seconds value
ttl key 查看有效期
10.23.117.188:6379> setex name 5 lisi
OK
10.23.117.188:6379> get name
"lisi"
10.23.117.188:6379>
10.23.117.188:6379> get name
(nil)
10.23.117.188:6379> ttl name
- 设置多个键值
mset key1 value1 key2 value2 …
10.23.117.188:6379> mset a1 python a2 java a3 c++
OK
10.23.117.188:6379> get a1
"python"
10.23.117.188:6379> get a2
"java"
10.23.117.188:6379> get a3
"c++"
10.23.117.188:6379>
- 追加值
append key value
例如向 a1后追加"I love you"
10.23.117.188:6379> append a1 "I love you"
(integer) 16
10.23.117.188:6379> get a1
"pythonI love you"
10.23.117.188:6379>
- 获取字符串长度
strlen key
10.23.117.188> set name laowang
OK
10.23.117.188> strlen name
(integer) 7
获取
- 根据键获取值,如果不存在此键则返回nil
get key
10.23.117.188:6379> get a2
"java"
10.23.117.188:6379>
- 根据多个键获取多个值
mget key1 key2 …
10.23.117.188:6379> mget a1 a2 a3
1) "pythonI love you"
2) "java"
3) "c++"
10.23.117.188:6379>
删除
delete key
string 类型数据的业务场景
业务场景 1
在大型企业级应用中,分表操作是基本操作,使用多张表存储同类型数据,但是对应的主键 id 必须保证统一性
,不能重复。Oracle 数据库具有 sequence 设定,可以解决该问题,但是 MySQL数据库并不具有类似的机制,那么如何解决?
解决方案
- 设置数值数据增加指定范围的值
incr key
incrby key increment
incrbyfloat key increment
- 设置数值数据减少指定范围的值
decr key
decrby key increment
- string在redis内部存储默认就是一个字符串,当遇到增减类操作incr,decr时会转成数值型进行计算
- redis所有的操作都是原子性的,采用单线程处理所有业务,命令是一个一个执行的,因此无需考虑并发
带来的数据影响。 - 注意:按数值进行操作的数据,如果原始数据不能转成数值,或超越了redis 数值上限范围,将报错
- redis用于控制数据库表主键id,为数据库表主键提供生成策略,保障数据库表的主键唯一性
- 此方案适用于所有数据库,且支持数据库集群
业务场景2
- “最强女生”启动海选投票,只能通过微信投票,每个微信号每 3 小时只能投1票。
- 电商商家开启热门商品推荐,热门商品不能一直处于热门期,每种商品热门期维持5天,5天后自动取消热门。
- 新闻网站会出现热点新闻,热点新闻最大的特征是时效性,如何自动控制热点新闻的时效性。
解决方案
设置数据具有指定的生命周期
setex key seconds value
psetex key milliseconds value
- redis 控制数据的生命周期,通过数据是否失效控制业务行为,适用于所有具有时效性限定控制的操作
业务场景3
主页高频访问信息显示控制,例如新浪微博大V主页显示粉丝数与微博数量
解决方案
- 方式1: 在redis中为大V用户设定用户信息,以用户主键和属性值作为key,后台设定定时刷新策略即可
set user:id:123456:fans 26970000
set user:id:123456:blogs 428
set user:id:123456:focuss 182
- 方式2:在redis中以json格式存储大V用户信息,定时刷新(也可以使用hash类型)
set user:id:123456 {"id":123456,"name":"李子柒","fans":26970000,"blogs":428, "focus":182}
- tips: redis应用于各种结构型和非结构型高热度数据访问加速
2. key 的操作
key 的设置约定 数据库中的热点数据key命名惯例
- 查找键,参数⽀持正则表达式
keys pattern
例如,查看所有键 keys *
10.23.117.188:6379> keys *
1) "backup1"
2) "a1"
3) "backup2"
4) "backup4"
5) "a3"
6) "a2"
7) "backup3"
10.23.117.188:6379>
- 查看名字中包含a 的
keys “a*”
10.23.117.188:6379> keys "a*"
1) "a1"
2) "a3"
3) "a2"
- 判断键是否存在,如果存在返回1,不存在返回0
exists key
10.23.117.188:6379> exists a1
(integer) 1
10.23.117.188:6379> exists a4
(integer) 0
10.23.117.188:6379>
- 查看键对应的value的类型,为redis⽀持的五种类型中的⼀种
type key
10.23.117.188:6379> type a1
string
10.23.117.188:6379>
- 删除键及对应的值
del key1 key2 …
10.23.117.188:6379> del a1 a3
(integer) 2
10.23.117.188:6379>
- 设置过期时间,以秒为单位,如果没有指定过期时间则⼀直存在,直到使⽤DEL移除
expire key seconds
例如, 设置a2的过期时间为5秒
10.23.117.188:6379> expire a2 5
(integer) 1
10.23.117.188:6379> get a2
"java"
10.23.117.188:6379> get a2
(nil)
10.23.117.188:6379>
- 查看有效时间,以秒为单位
ttl key
10.23.117.188:6379> setex a1 10 python
OK
10.23.117.188:6379> ttl a1
(integer) 3
10.23.117.188:6379> ttl a1
(integer) -2
10.23.117.188:6379> ttl a1
(integer) -2
10.23.117.188:6379> ttl a1
(integer) -2
10.23.117.188:6379>
3. hash类型
对象类数据的存储如果具有较频繁的更新需求操作,,则用string类型会显得笨重
- 新的存储需求:对一系列存储的数据进行编组,方便管理,典型应用存储对象信息
- 需要的存储结构:一个存储空间保存多个键值对数据
- hash类型:底层使用哈希表结构实现数据存储
- 如果field数量较少,存储结构优化为类数组结构
- 如果field数量较多,存储结构使用HashMap结构
- Redis hash 是一个 string 类型的 field(字段) 和 value(值) 的映射表,hash 特别适合用于存储对象(想象成Python中的实例对象)。
- Redis 中每个 hash 可以存储 232 - 1 键值对(40多亿)
增加
hset key filed value [field value……]
10.23.117.188:6379> hset person name laowang age 18
(integer) 2
10.23.117.188:6379>
查询
hget key field
10.23.117.188:6379> type person
hash
10.23.117.188:6379> hget person name
"laowang"
10.23.117.188:6379> hget person age
"18"
10.23.117.188:6379>
- 设置多个和多个查询
hmset key field value [field value……]
hmget key field [field……]
10.23.117.188:6379> hmset person name lisi age 20
OK
10.23.117.188:6379> hmget person name age
1) "lisi"
2) "20"
10.23.117.188:6379>
- 列出指定key下的所有字段和字段值
hgetall key
10.23.117.188:6379> hgetall person
1) "name"
2) "lisi"
3) "age"
4) "20"
10.23.117.188:6379>
- 获取key 下所有字段field(获取所有key)
hkeys key - 获取key下所有value(获取所有field的值)
hvals key
10.23.117.188:6379> hkeys person
1) "name"
2) "age"
10.23.117.188:6379> hvals person
1) "lisi"
2) "20"
10.23.117.188:6379>
- 获取hash表中字段的数量
hlen key - 获取hash表中是否存在指定的字段
hexists key field - 设置指定字段的数值数据增加指定范围的值
hincrby key field increment
hincrbyfloat key field increment
删除
- 删除单个或多个字段
hdel key field [field……]
10.23.117.188:6379> hdel person
(error) ERR wrong number of arguments for 'hdel' command
10.23.117.188:6379> hdel person name age
(integer) 2
10.23.117.188:6379>
- 删除整个key
del key
10.23.117.188:6379> hset person name laowang age 18
(integer) 2
10.23.117.188:6379> del person
(integer) 1
10.23.117.188:6379> hget person
(error) ERR wrong number of arguments for 'hget' command
10.23.117.188:6379> hget person name
更新
10.23.117.188:6379> hset person name laowang age 18
(integer) 2
10.23.117.188:6379> hgetall person
1) "name"
2) "laowang"
3) "age"
4) "18"
10.23.117.188:6379> hset person name lisi age 20
(integer) 0
10.23.117.188:6379> hgetall person
1) "name"
2) "lisi"
3) "age"
4) "20"
10.23.117.188:6379>
hash 类型数据操作的注意事项
- hash类型下的value只能存储字符串,不允许存储其他数据类型,不存在嵌套现象。如果数据未获取到,
对应的值为(nil) - hash类型十分贴近对象的数据存储形式,并且可以灵活添加删除对象属性。但hash设计初衷不是为了存
储大量对象而设计的,切记不可滥用,更不可以将hash作为对象列表使用 - hgetall 操作可以获取全部属性,如果内部field过多,遍历整体数据效率就很会低,有可能成为数据访问
瓶颈
hash类型应用场景
- 业务场景1. 电商网站购物车设计与实现, redis 应用于购物车数据存储设计
业务分析
- 仅分析购物车的redis存储模型 添加、浏览、更改数量、删除、清空
- 购物车与数据库间持久化同步(不讨论)
- 购物车与订单间关系(不讨论) 提交购物车:读取数据生成订单, 商家临时价格调整:隶属于订单级别
- 未登录用户购物车信息存储(不讨论) session存储
解决方案
- 以客户id作为key,每位客户创建一个hash存储结构存储对应的购物车信息
- 将商品编号作为field,购买数量作为value进行存储
- 添加商品:追加全新的field与value
- 浏览:遍历hash hgetall
- 更改数量:自增/自减,设置value值 hincrby
- 删除商品:删除field hdel
- 清空:删除key del
代码实现:
- 用户001 添加编号为100的商品5件并查看
127.0.0.1:6379> hset userid:001 goodsid:100 5
(integer) 1
127.0.0.1:6379> hget userid:001 goodsid:100
"5"
- 用户001又添加编号为101的商品10件并查看所有商品
127.0.0.1:6379> hset userid:001 goodsid:101 10
(integer) 1
127.0.0.1:6379> hgetall userid:001
1) "goodsid:100"
2) "5"
3) "goodsid:101"
4) "10"
- 增加10件101号商品并查看所有
127.0.0.1:6379> hincrby userid:001 goodsid:101 10
(integer) 20
127.0.0.1:6379> hgetall userid:001
1) "goodsid:100"
2) "5"
3) "goodsid:101"
4) "20"
127.0.0.1:6379>
- 删除101号商品
127.0.0.1:6379> hdel userid:001 goodsid:101
(integer) 1
127.0.0.1:6379> hgetall userid:001
1) "goodsid:100"
2) "5"
127.0.0.1:6379>
- 清空购物车
127.0.0.1:6379> del userid:001
(integer) 1
127.0.0.1:6379> keys *
(empty array)
127.0.0.1:6379>
注意:
- 此处仅讨论购物车中的模型设计
- 购物车与数据库间持久化同步、购物车与订单间关系、未登录用户购物车信息存储不进行讨论
思考:当前设计是否加速了购物车的呈现
当前仅仅是将数据存储到了redis中,并没有起到加速的作用,商品信息还需要二次查询关联的关系型数据库
新方案:
- 每条购物车中的商品记录保存成两条field
- field1专用于保存购买数量
命名格式:商品id:nums
保存数据:数值 - field2专用于保存购物车中显示的信息,包含文字描述,图片地址,所属商家信息等
命名格式:商品id:info
保存数据:json
代码实现:
127.0.0.1:6379> hmset userid:002 goodsid:100:nums 10 goodsid:100:info {.....}
OK
127.0.0.1:6379> hgetall userid:002
1) "goodsid:100:nums"
2) "10"
3) "goodsid:100:info"
4) "{.....}"
127.0.0.1:6379>
通常,由于不同的人可能买的商品一样,因此fields2会重复,思路是把fields2独立出一个hash,并且可以用
hsetnx key field value 去重
- 业务场景2. 双11活动日,销售手机充值卡的商家对移动、联通、电信的30元、50元、100元商品推出抢购活动,每种商
品抢购上限1000张
解决方案
- 以商家id作为key
- 将参与抢购的商品id作为field
- 将参与抢购的商品数量作为对应的value
- 抢购时使用降值的方式控制产品数量
- 实际业务中还有超卖等实际问题,这里不做讨论
- string存储对象(json)与hash存储对象 ,前者是一整体,偏向于读,后者偏向于更新方便
代码实现:
- 入库
127.0.0.1:6379> hmset userid:01 c30 1000 c50 1000 c100 1000
OK
127.0.0.1:6379> hgetall userid:01
1) "c30"
2) "1000"
3) "c50"
4) "1000"
5) "c100"
6) "1000"
127.0.0.1:6379>
商家01卖出c50 10张
127.0.0.1:6379> hincrby userid:01 c50 -10
(integer) 990
127.0.0.1:6379> hgetall userid:01
1) "c30"
2) "1000"
3) "c50"
4) "990"
5) "c100"
6) "1000"
127.0.0.1:6379>
4. list 列表
- 列表的元素类型为string,最多223-1个元素
- 数据存储需求:存储多个数据,并对数据进入存储空间的顺序进行区分
- 需要的存储结构:一个存储空间保存多个数据,且通过数据可以体现进入顺序
- list类型:保存多个数据,底层使用双向链表存储结构实现
增加
- 从左边插入
lpush key element [element……]
例1: 从键为’a1’的列表左侧加⼊数据a 、 b 、c
10.23.117.188:6379> lpush a1 a b c
(integer) 3
10.23.117.188:6379> lrange a1 0 2
1) "c"
2) "b"
3) "a"
- 从右边插入
rpush key element [element]
例2:从键为’a1’的列表右侧加⼊数据0 1
10.23.117.188:6379> rpush a1 0 1
(integer) 5
10.23.117.188:6379> lrange a1 0 5
1) "c"
2) "b"
3) "a"
4) "0"
5) "1"
10.23.117.188:6379>
- 在指定元素的前或后插⼊新元素
linsert key before或after 现有元素 新元素
例3:在键为’a1’的列表中元素’b’前加⼊’3’
10.23.117.188:6379> linsert a1 before b 3
(integer) 6
10.23.117.188:6379> lrange a1 0 6
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379>
获取
- lrange key start stop 列表切片查看
- 索引可以是负数,表示尾部开始计数,如-1表示最后⼀个元素
10.23.117.188:6379> lrange a1 0 0
1) "c"
10.23.117.188:6379> lrange a1 0 5
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379> lrange a1 0 6
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379> lrange a1 0 7
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379> lrange a1 0 -1
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379> lrange a1 0 -2
1) "c"
2) "3"
3) "b"
4) "a"
5) "0"
10.23.117.188:6379>
- 获取指定索引数据
lindex key index
llen key - 获取并移除数据
lpop key
rpop key
修改(更新)
lset key index element
例如 将a1 下标为2 的元素修改为 haha
10.23.117.188:6379> lset a1 2 haha
OK
10.23.117.188:6379> lrange a1 0 -1
1) "c"
2) "3"
3) "haha"
4) "a"
5) "0"
6) "1"
10.23.117.188:6379>
删除
- lrem key count element
- 将列表中前count次出现的值为value的元素移除
- count > 0: 从头(左)往尾移除
- count < 0: 从尾(右)往头移除
- count = 0: 移除所有
例如:向列表’a2’中加⼊元素’a’、‘b’、‘a’、‘b’、‘a’、‘b’
10.23.117.188:6379> lpush a2 a b a b a b
(integer) 6
10.23.117.188:6379> lrange a2 0 -1
1) "b"
2) "a"
3) "b"
4) "a"
5) "b"
6) "a"
10.23.117.188:6379>
从a2 右侧删除两个a
10.23.117.188:6379> lrem a2 -2 a
(integer) 2
10.23.117.188:6379> lrange a2 0 -1
1) "b"
2) "a"
3) "b"
4) "b"
10.23.117.188:6379>
- del key 将整个列表都删除
- 阻塞等待不同的key 一定时间,如果取出弹出,如果没取出阻塞,知道timeout
blpop key [key……] timeout
127.0.0.1:6379> lpush list1 a b c
(integer) 3
127.0.0.1:6379> lrange list1 0 -1
1) "c"
2) "b"
3) "a"
127.0.0.1:6379> blpop list1 5
1) "list1"
2) "c"
127.0.0.1:6379> blpop list1 5
1) "list1"
2) "b"
127.0.0.1:6379> blpop list1 5
1) "list1"
2) "a"
127.0.0.1:6379> blpop list1 5
(nil)
(5.09s)
127.0.0.1:6379>
list 类型应用场景
- 场景1
微信朋友圈点赞,要求按照点赞顺序显示点赞好友信息
如果取消点赞,移除对应好友信息 - 场景2
twitter、新浪微博、腾讯微博,keep应用中个人用户的关注列表需要按照用户的关注顺序进行展示,粉丝列表需要将最
近关注的粉丝列在前面 - 场景3
新闻、资讯类网站如何将最新的新闻或资讯按照发生的时间顺序展示?
企业运营过程中,系统将产生出大量的运营数据,如何保障多台服务器操作日志的统一顺序输出? - 解决方案
- 依赖list的数据具有顺序的特征对信息进行管理
- 使用队列模型解决多路信息汇总合并的问题
- 使用栈模型解决最新消息的问题
总结:redis 应用于最新消息展示 ,redis 应用于具有操作先后顺序的数据控制 。
,
5.set类型
- 新的存储需求:存储大量的数据,在查询方面提供更高的效率
- 高效的内部存储机制,便于查询
- ⽆序集合
- 元素为string类型
- 元素具有唯⼀性,不重复
- 与hash存储结构完全相同,仅存储键,不存储值(nil),并且值是不允许重复的
- 说明:对于集合没有修改操作
增加
sadd key member [member]
例1:向键’a3’的集合中添加元素’zhangsan’、‘lisi’、‘wangwu’
10.23.117.188:6379> sadd a3 zhangsan lisi wangwu
(integer) 3
10.23.117.188:6379>
获取
smembers key
获取a3 所有元素
10.23.117.188:6379> smembers a3
1) "wangwu"
2) "zhangsan"
3) "lisi"
10.23.117.188:6379>
删除
删除指定元素
srem key member [member]
10.23.117.188:6379> srem a3 wangwu
(integer) 1
10.23.117.188:6379> smembers a3
1) "zhangsan"
2) "lisi"
10.23.117.188:6379>
获取集合数据总量
scard key
判断集合中是否包含指定数据sismember key member
set应用场景
场景1
每位用户首次使用今日头条时会设置几项爱好的内容,但是后期为了增加用户的活跃度、兴趣点,必须让用户对其他信息类别逐渐产生兴趣,增加客户留存度,如何实现?
- 业务分析
- 系统分析出各个分类的最新或最热点信息条目并组织成set集合
- 随机挑选其中部分信息
- 配合用户关注信息分类中的热点信息组织成展示的全信息集合
- 解决方案
- 随机获取集合中指定数量的数据
srandmember key [count]
- 随机获取集合中的某个数据并将该数据移出集合
spop key [count]
127.0.0.1:6379> sadd news n1 n2 n3 n4 n5 # 添加新闻
(integer) 5
127.0.0.1:6379> scard news
(integer) 5
127.0.0.1:6379> smembers news # 查看新闻
1) "n4"
2) "n3"
3) "n2"
4) "n1"
5) "n5"
127.0.0.1:6379> srandmember news 2 # 随机推送两条,不删除
1) "n4"
2) "n2"
127.0.0.1:6379> smembers news
1) "n4"
2) "n3"
3) "n2"
4) "n1"
5) "n5"
127.0.0.1:6379> spop news 3 # 随机推送三条,删除
1) "n4"
2) "n2"
3) "n3"
127.0.0.1:6379> smembers news
1) "n1"
2) "n5"
127.0.0.1:6379>
Trips: redis 应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热卖旅游线路,应用APP推荐, 大V推荐等
场景2
- 脉脉为了促进用户间的交流,保障业务成单率的提升,需要让每位用户拥有大量的好友,事实上职场新人不具有更多的职场好友,如何快速为用户积累更多的好友?
- 新浪微博为了增加用户热度,提高用户留存性,需要微博用户在关注更多的人,以此获得更多的信息或热门话题,如何提高用户关注他人的总量?
- QQ新用户入网年龄越来越低,这些用户的朋友圈交际圈非常小,往往集中在一所学校甚至一个班级中,如何帮助用户快速积累好友用户带来更多的活跃度?
- 微信公众号是微信信息流通的渠道之一,增加用户关注的公众号成为提高用户活跃度的一种方式,如何帮助用户积累更多关注的公众号?
- 美团外卖为了提升成单量,必须帮助用户挖掘美食需求,如何推荐给用户最适合自己的美食?
- 业务分析
1. 用户与用户之间的关联度(交集,并集,差集),用户与其他用户附加信息之间的关联度。 - 解决方案
- 求两个集合的交、并、差集
sinter key1 [key2]
sunion key1 [key2]
sdiff key1 [key2]
- 求两个集合的交、并、差集并存储到指定集合中
sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
- 将指定数据从原始集合中移动到目标集合中
smove source destination member
127.0.0.1:6379> sadd s1 a b c d # 创建集合s1
(integer) 4
127.0.0.1:6379> sadd s2 b c e f g # 创建集合s2
(integer) 5
127.0.0.1:6379> sinter s1 s2 # 交集
1) "b"
2) "c"
127.0.0.1:6379> sunion s1 s2 # 并集
1) "b"
2) "d"
3) "a"
4) "e"
5) "g"
6) "f"
7) "c"
127.0.0.1:6379> sdiff s1 s2 # 差集
1) "a"
2) "d"
127.0.0.1:6379> sinterstore s3 s1 s2 # 将s1 s2的交集放入s3
(integer) 2
127.0.0.1:6379> smembers s3
1) "b"
2) "c"
127.0.0.1:6379> smove s1 s2 a # 将s1 中的a放入s2
(integer) 1
127.0.0.1:6379> smembers s1
1) "b"
2) "d"
3) "c"
127.0.0.1:6379> smembers s2
1) "b"
2) "a"
3) "e"
4) "g"
5) "c"
6) "f"
- Tips:
- set注意事项
- set 类型不允许数据重复,如果添加的数据在 set 中已经存在,将只保留一份
- set 虽然与hash的存储结构相同,但是无法启用hash中存储值的空间(value为nil)
场景3
- 公司对旗下新的网站做推广,统计网站的PV (Page View)(访问量),UV (Unique Visitor)(独立访客),IP(Internet Protocol)(独立IP)。
- PV:网站被访问次数,可通过刷新页面提高访问量
- UV:网站被不同用户访问的次数,可通过cookie统计访问量,相同用户切换IP地址,UV不变
- IP:网站被不同IP地址访问的总次数,可通过IP地址统计访问量,相同IP不同用户访问,IP不变
- 解决方案
- 利用set集合的数据去重特征,记录各种访问数据
- 建立string类型数据,利用incr统计日访问量(PV)
- 建立set模型,记录不同cookie数量(UV)
- 建立set模型,记录不同IP数量(IP)
# 记录ip
127.0.0.1:6379> sadd ip 1.2.3.4 # 记录ip1
(integer) 1
127.0.0.1:6379> sadd ip 1.2.4.5 # 记录ip2
(integer) 1
127.0.0.1:6379> sadd ip 1.2.3.5 # 记录ip3
(integer) 1
127.0.0.1:6379> sadd ip 1.2.4.5 # 重复ip访问
(integer) 0
127.0.0.1:6379> scard ip # 查看访问统计量
(integer) 3
127.0.0.1:6379>
# 记录Pv
127.0.0.1:6379> incrby pv 1
(integer) 1
127.0.0.1:6379> incr pv
(integer) 2
127.0.0.1:6379> incr pv
(integer) 3
127.0.0.1:6379> incr pv
(integer) 4
127.0.0.1:6379> get pv
"4"
- Tips 11:
redis 应用于同类型数据的快速去重
场景 4
- 黑名单
资讯类信息类网站追求高访问量,但是由于其信息的价值,往往容易被不法分子利用,通过爬虫技术,快速获取信息,个别特种行业网站信息通过爬虫获取分析后,可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件,电商刷评论、刷好评。 同时爬虫带来的伪流量也会给经营者带来错觉,产生错误的决策,有效避免网站被爬虫反复爬取成为每个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后,需要将此类用户进行有效的屏蔽,这就是黑名单的典型应用。
ps:不是说爬虫一定做摧毁性的工作,有些小型网站需要爬虫为其带来一些流量。 - 白名单
对于安全性更高的应用访问,仅仅靠黑名单是不能解决安全问题的,此时需要设定可访问的用户群体,依赖白名单做更为苛刻的访问验证。 - 解决方案
- 基于经营战略设定问题用户发现、鉴别规则
- 周期性更新满足规则的用户黑名单,加入set集合
- 用户行为信息达到后与黑名单进行比对,确认行为去向
- 黑名单过滤IP地址:应用于开放游客访问权限的信息源
- 黑名单过滤设备信息:应用于限定访问设备的信息源
- 黑名单过滤用户:应用于基于访问权限的信息源
- Tips 12:
redis 应用于基于黑名单与白名单设定的服务控制
6. zset类型(有序集合)
- sorted set,有序集合
- 新的存储需求:数据排序有利于数据的有效展示,需要提供一种可以根据自身特征进行排序的方式
- 需要的存储结构:新的存储模型,可以保存可排序的数据
- sorted_set类型:在set的存储结构基础上添加可排序字段
- 元素为string类型
- 元素具有唯⼀性,不重复
- 每个元素都会关联⼀个double类型的score,表示权重,通过权重将元素从⼩到⼤排序
说明:没有修改操作
增加
zadd key score member [score member……]
例:向键’a4’的集合中添加元素’lisi’、‘wangwu’、‘zhaoliu’、‘zhangsan’,权重分别为4、5、6、3
10.23.117.188:6379> zadd a4 4 lisi 5 wangwu 6 zhaoliu 3 zhangsan
(integer) 4
10.23.117.188:6379>
获取
zrange key start stop
反向查看zrevrange key start stop [WITHSCORES]
- 返回指定范围内的元素
- start、stop为元素的下标索引
- 索引从左侧开始,第⼀个元素为0
- 索引可以是负数,表示从尾部开始计数,如-1表示最后⼀个元素
获取a4集合的所有元素
10.23.117.188:6379> zrange a4 0 -1
1) "zhangsan"
2) "lisi"
3) "wangwu"
4) "zhaoliu"
127.0.0.1:6379> zrange a4 0 -1 withscores
1) "zhangsan"
2) "3"
3) "lisi"
4) "4"
5) "wangwu"
6) "5"
7) "zhaoliu"
8) "6"
127.0.0.1:6379>
- 返回score值在min和max之间的成员
zrangebyscore key min max
- 获取键’a4’的集合中权限值在5和6之间的成员
zrangebyscore a4 5 6
10.23.117.188:6379> zrangebyscore a4 5 6
1) "wangwu"
2) "zhaoliu"
10.23.117.188:6379>
- 返回成员member的score值
zscore key member
例:获取键’a4’的集合中元素’zhangsan’的权重
10.23.117.188:6379> zscore a4 zhangsan
"3"
10.23.117.188:6379>
- 获取集合数据总量
zcard key
zcount key min max
- 交集并集操作
zinterstore destination numkeys key [key ...]
zunionstore destination numkeys key [key ...]
删除
- 删除指定元素
zrem key member1 member2 ...
例:删除集合’a4’中元素’zhangsan’
zrem a4 zhangsan
10.23.117.188:6379> zrem a4 zhangsan
(integer) 1
10.23.117.188:6379> zrange a4 0 -1
1) "lisi"
2) "wangwu"
3) "zhaoliu"
10.23.117.188:6379>
- 删除权重在指定范围的元素
zremrangebyscore key min max
例:删除集合’a4’中权限在5、6之间的元素
zremrangebyscore a4 5 6
10.23.117.188:6379> zremrangebyscore a4 5 6
(integer) 2
10.23.117.188:6379> zrange a4 0 -1
1) "lisi"
10.23.117.188:6379>
注意:
- min与max用于限定搜索查询的条件
- start与stop用于限定查询范围,作用于索引,表示开始和结束索引
- offset与count用于限定查询范围,作用于查询结果,表示开始位置和数据总量
场景1
- 各类资源网站TOP10(电影,歌曲,文档,电商,游戏等)
- 聊天室活跃度统计
- 游戏好友亲密度
- 热点直播间
- 榜单类数据排序与统计
- 业务分析
为所有参与排名的资源建立排序依据 - 解决方案
- 获取数据对应的索引(排名)
zrank key member
zrevrank key member
127.0.0.1:6379> zadd movies 150 aaa 87 bbb 345 ccc 29 ddd # 添加电影点击量
(integer) 4
:6379> zcard movies
(integer) 4
127.0.0.1:6379> zrank movies aaa # aaa的电影点击排名
(integer) 2
127.0.0.1:6379> zrank movies ccc
(integer) 3
127.0.0.1:6379> zrank movies bbb
(integer) 1
127.0.0.1:6379> zrank movies ddd
(integer) 0
127.0.0.1:6379> zscore movies aaa # 查看aaa的电影点击量
"150"
127.0.0.1:6379> zincrby movies 1 aaa # 给aaa的电影增加点击量
"151"
127.0.0.1:6379>
- Tips :
redis 应用于计数器组合排序功能对应的排名
sorted_set 类型数据操作的注意事项
- score保存的数据存储空间是64位,如果是整数范围是-9007199254740992~9007199254740992
- score保存的数据也可以是一个双精度的double值,基于双精度浮点数的特征,可能会丢失精度,使用时
候要慎重 - sorted_set 底层存储还是基于set结构的,因此数据不能重复,如果重复添加相同的数据,score值将被反
复覆盖,保留最后一次修改的结果
场景2
- 基础服务+增值服务类网站会设定各位会员的试用,让用户充分体验会员优势。例如观影试用VIP、游戏VIP体验、云盘下载体验VIP、数据查看体验VIP。当VIP体验到期后,如果有效管理此类信息。即便对于正式VIP用户也存在对应的管理方式。 网站会定期开启投票、讨论,限时进行,逾期作废。如何有效管理此类过期信息。
- 解决方案
- 对于基于时间线限定的任务处理,将处理时间记录为score值,利用排序功能区分处理的先后顺序
- 记录下一个要处理的时间,当到期后处理对应任务,移除redis中的记录,并记录下一个要处理的时间
- 当新任务加入时,判定并更新当前下一个要处理的任务时间
- 为提升sorted_set的性能,通常将任务根据特征存储成若干个sorted_set。例如1小时内,1天内,周内,
月内,季内,年度等,操作时逐级提升,将即将操作的若干个任务纳入到1小时内处理的队列中
127.0.0.1:6379> time
1) "1604388343"
2) "453297"
127.0.0.1:6379> zadd huiyuan 11111233 uid:001 # 设置11111233时过期
(integer) 1
127.0.0.1:6379> zadd huiyuan 22223333 uid:002
(integer) 1
127.0.0.1:6379> zadd huiyuan 6374638 uid:003
(integer) 1
127.0.0.1:6379> zrange huiyuan 0 -1 wthscores
(error) ERR syntax error
127.0.0.1:6379> zrange huiyuan 0 -1 withscores
1) "uid:003"
2) "6374638"
3) "uid:001"
4) "11111233"
5) "uid:002"
6) "22223333"
127.0.0.1:6379>
- Tips 14:
redis 应用于定时任务执行顺序管理或任务过期管理
场景3
任务/消息权重设定应用
当任务或者消息待处理,形成了任务队列或消息队列时,对于高优先级的任务要保障对其优先处理,如何实现任务权重管理。
对于带有权重的任务,优先处理权重高的任务,采用score记录权重即可
多条件任务权重设定
报错解决方案
(error) MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk. Commands that may modify the data set are disabled. Please check Redis logs for details about the error. 大意为:(错误)misconf redis被配置以保存数据库快照,但misconf redis目前不能在硬盘上持久化。用来修改数据集合的命令不能用,请使用日志的错误详细信息。
解决方案如下:
连接redis后运行 config set stop-writes-on-bgsave-error no 命令
关闭配置项stop-writes-on-bgsave-error解决该问题。
redis综合实践
业务场景一
- 人工智能领域的语义识别与自动对话将是未来服务业机器人应答呼叫体系中的重要技术,百度自研用户评价
语义识别服务,免费开放给企业试用,同时训练百度自己的模型。现对试用用户的使用行为进行限速,限制
每个用户每分钟最多发起10次调用
解决方案
- 设计计数器,记录调用次数,用于控制业务执行次数。以用户id作为key,使用次数作为value
- 在调用前获取次数,判断是否超过限定次数
- 不超过次数的情况下,每次调用计数+1
- 业务调用失败,计数-1
- 为计数器设置生命周期为指定周期,例如1秒/分钟,自动清空周期内使用次数
127.0.0.1:6379> setex uid:00415 60 1 # 设置uid:00415过期时间并统计计数
OK
127.0.0.1:6379> get uid:00415
"1"
127.0.0.1:6379> incr uid:00415
(integer) 2
127.0.0.1:6379> incr uid:00415
(integer) 3
127.0.0.1:6379> incr uid:00415
(integer) 4
127.0.0.1:6379> get uid:00415
"4"
解决方案改良
- 取消最大值的判定,利用incr操作超过最大值抛出异常的形式替代每次判断是否大于最大值
- 判断是否为nil,
- 如果是,设置为Max-次数
- 如果不是,计数+1
- 业务调用失败,计数-1
- 遇到异常即+操作超过上限,视为使用达到上限
127.0.0.1:6379> get uid:00415
(nil)
127.0.0.1:6379> set uid:00415 9223372036854775797 # 最大值减10
OK
127.0.0.1:6379> incr uid:00415 # 加1
(integer) 9223372036854775798
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775799
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775800
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775801
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775802
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775803
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775804
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775805
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775806
127.0.0.1:6379> incr uid:00415
(integer) 9223372036854775807
127.0.0.1:6379> incr uid:00415
(error) ERR increment or decrement would overflow # 超过加10 报错,从而可以捕获错误判断
127.0.0.1:6379>
业务场景二
- 使用微信的过程中,当微信接收消息后,会默认将最近接收的消息置顶,当多个好友及关注的订阅号同时发
送消息时,该排序会不停的进行交替。同时还可以将重要的会话设置为置顶。一旦用户离线后,再次打开微
信时,消息该按照什么样的顺序显示? - 解决方案
- 依赖list的数据具有顺序的特征对消息进行管理,将list结构作为栈使用
- 对置顶与普通会话分别创建独立的list分别管理
- 当某个list中接收到用户消息后,将消息发送方的id从list的一侧加入list(此处设定左侧)
- 多个相同id发出的消息反复入栈会出现问题,在入栈之前无论是否具有当前id对应的消息,先删除对应id
- 推送消息时先推送置顶会话list,再推送普通会话list,推送完成的list清除所有数据
- 消息的数量,也就是微信用户对话数量采用计数器的思想另行记录,伴随list操作同步更新
# 放入消息的顺序为 200 300 400 200 300
127.0.0.1:6379> lrem 100 1 200
(integer) 0
127.0.0.1:6379> lpush 100 200
(integer) 1
127.0.0.1:6379> lrem 100 1 300
(integer) 0
127.0.0.1:6379> lpush 100 300
(integer) 2
127.0.0.1:6379> lrem 100 1 400
(integer) 0
127.0.0.1:6379> lpush 100 400
(integer) 3
127.0.0.1:6379> lrem 100 1 200
(integer) 1
127.0.0.1:6379> lpush 100 200
(integer) 3
127.0.0.1:6379> lrem 100 1 300
(integer) 1
127.0.0.1:6379> lpush 100 300
(integer) 3
127.0.0.1:6379> lrange 100 0 -1
1) "300"
2) "200"
3) "400" # 最终从右到左(从新到旧)的顺序为300 200 400
127.0.0.1:6379>
大总结
- Tips 1:redis用于控制数据库表主键id,为数据库表主键提供生成策略,保障数据库表的主键唯一性
- Tips 2:redis 控制数据的生命周期,通过数据是否失效控制业务行为,适用于所有具有时效性限定控制的操作
- Tips 3:redis应用于各种结构型和非结构型高热度数据访问加速
- Tips 4:redis 应用于购物车数据存储设计
- Tips 5:redis 应用于抢购,限购类、限量发放优惠卷、激活码等业务的数据存储设计
- Tips 6:redis 应用于具有操作先后顺序的数据控制
- Tips 7:redis 应用于最新消息展示
- Tips 8:redis 应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热卖旅游线路,应用APP推荐,大V推荐等
- Tips 9:redis 应用于同类信息的关联搜索,二度关联搜索,深度关联搜索
- Tips 10:redis 应用于同类型不重复数据的合并、取交集操作
- Tips 11:redis 应用于同类型数据的快速去重
- Tips 12:redis 应用于基于黑名单与白名单设定的服务控制
- Tips 13:redis 应用于计数器组合排序功能对应的排名
- Tips 14:redis 应用于定时任务执行顺序管理或任务过期管理
- Tips 15:redis 应用于及时任务/消息队列执行管理
- Tips 16:redis 应用于按次结算的服务控制
- Tips 17:redis 应用于基于时间顺序的数据操作,而不关注具体时间