readConcern
  • 问题综述:(在读取数据的过程中需要关注以下两个问题)
  1. 从哪里读?即关注数据节点的位置。
  2. 什么样的数据可以读?关注数据的隔离性。
  • 第一个问题是由 readPreference 来解决的。
  • readPreference 在很早的版本就有了。
  • readPreference 以下五个可选值:
  1. primary:只选择主节点;
  2. primaryPreferred:优先选择主节点,如果不可用则选择从节点;
  3. secondary:只选择从节点;
  4. secondaryPreferred:优先选择从节点,如果从节点不可用则选择主节点;
  5. nearest:选择最近的节点(ping mongod服务器哪个最近就用哪个);
  • 场景举例:
  • 用户下订单后马上将用户转到订单详情页面——primary/primaryPreferred。因为此时从节点可能还没复制到新订单;
  • 用户查询自己下过的订单——secondary/secondaryPreferred。查询历史订单对实效性通常没有太高的要求;
  • 生成报表——secondary。报表对实效性要求不高,但资源需求大,可以在从节点单独处理,避免对线上用户造成影响;
  • 将用户上传的图片分发到全世界,让各地用户能够就近读取——nearest。每个地区的应用选择最近的节点读取数据;
  • readPreference 与 Tag
  • readPreference 只能控制使用一类节点。Tag则可以将节点选择控制到一个或几个节点。考虑以下场景:
  • 一个5节点的复制集;
  • 3个节点(1主2从)硬件较好,专用于服务线上用户(OLTP);
  • 2个节点(2从)硬件较差,专用于生成报表(OLAP);
  • 可以使用Tag来达到这样的控制目的:
  • 为3个较好的节点打上 {purpose:"online"};
  • 为2个较差的节点打上 {purpose:"analyse"};
  • 在线应用读取时指定online,报表读取时指定reporting。
  • readPreference 配置
  • 通过 MongoDB 的连接串参数:
mongodb://host1:27017,host2:27017,host3:27017/?replicatSet=rs&readPreference=secondary
  • 通过 MongoDB驱动程序API:
MongoCollection.withReadPreference(ReadPreference readPref)
  • Mongo Sehll(单个操作时指定):
db.collection.find({...}).readPref("secondary")
  • readPreference 实验:从节点读
  • 主节点写入{x:1},观察该数据在各个节点立即可见。
  • 在两个从节点分别执行 db.fsyncLock() 来锁定写入(同步)。
  • 主节点写入
  • db.test.find({a:123})
  • db.test.find({a:123}).readPref("secondary")
  • 解除从节点锁定 db.fsyncUnlock()
  • db.test.find({a:123}).readPref("secondary")
  • 注意事项:
  • 指定 readPreference 时应注意高可用的问题。例如将 readPreference 指定 primary,则发生故障转移不存在 primary 期间将没有节点可读。如果业务允许,则应选择 primaryPreferred;
  • 使用 Tag 时也会遇到同样的问题,如果只有一个节点拥有一个特定 Tag,则在这个节点失效时将无节点可读。这在有时候时期望结果,有时候不是。例如:
  • 如果报表使用的节点失效,即使不生成报表,也不希望将报表负载转移到其他节点上,此时只有一个节点有报表 Tag 是合理的选择。
  • 如果线上节点失效,通常希望有替代节点,所以应该保持多个节点有同样的 Tag;
  • Tag 有时需要与优先级、选举权综合考虑。例如做报表的节点通常不会希望它作为主节点,则优先级应该为0。
  • 第二个问题是由 readConcern 来解决。
  • 什么是 readConcern
  • 在 readPreference 选择了指定的节点后,readConcern 决定这个节点上的数据哪些是可读的,类似于关系数据库的隔离级别。
  • 可选值包括:
  • available 读取所有可用的数据,什么都不管;(从节点读取时默认 avaliable)
  • local 读取所有可用且属于当前分片的数据;(主节点读取时默认 local)
  • local 和 avaliable 在没有分片集群的情况下是几乎一致的。
  • 但是在分片迁移(chunk)的过程中,可能会存在数据同时出现在两个分片集的情况,这时可能会出现数据重复的问题。
  • majority 读取在大多数节点上提交完成的数据;(推荐使用)
  • linearizable 可线性化读取文档,保证这次的读是可以读到上一次的写的;
  • snapshot 读取最近快照中的数据,差不多可以达到关系型数据库中序列化的级别,隔离级别最高的;
  • 注意事项:
  • 在主节点读取数据时默认 readConcern 是 local,在从节点读取数据时默认的 readConcern 是 avaliable的(出于向前兼容);
  • MongoDB <= 3.6 不支持对从节点使用 {readConcern: "local"};
  • 虽然看上去总应该选择 local,但会在对结果集过滤过程产生额外消耗。在一些无关紧要的场景(如统计)下,也可以考虑使用 avaliabel。
  • readConcern: "majority"
  • Mongodb用户只读权限查看 mongodb readconcern_Mongodb用户只读权限查看

  • 实验:readConcern: "majority" vs "local"
  • 安装3节点复制集。
  • 注意在配置文件内 replication 的参数 enableMajorityReadConcern 需要打开。
replication:
  	replSetName: rs0
  	enableMajorityReadConcern: true
  • 将复制集中两个从节点使用 db.fsyncLock() 锁住写入(模拟同步高延迟)。
db.test.save({"a":1}) # 主节点:写入。
	db.fsyncLock() # 两个从节点:分别执行。
	db.test.find().readConcern("local")
	db.test.find().readConcern("majority") # 此时会阻塞
	db.fsyncUnlock() # 在一个从节点上解除写锁。
	db.test.find().readConcern("majority") # 这次可以成功读取。
  • 结论:
  • 使用 local 参数,则可以直接查询到写入数据。
  • 使用 majority,只能查询到已经被多数节点确认过的数据。
  • update 与 remove 与上同理。
  • readConcern: majority 与 脏读
  • MongoDB 中的回滚:
  • 写操作在到达大多数节点前都是不安全的,一旦主节点崩溃,从节点还没复制到此次操作,则刚才的写操作就丢失了。
  • 把一次写操作视为一个事务,从事务的角度,可以认为事务被回滚了。
  • 所以从分布式系统的角度来看,事务的提交被提升到了分布式集群多个节点级别的提交,而不再是单个节点上的提交。
  • 在可能发生回滚的前提下考虑脏读问题:
  • 如果在一次写操作到达大多数节点前读取了这个写操作,然后因为系统故障该操作回滚了,则发生了脏读问题;
  • 使用 {readConcern:"majority"} 可以有效避免脏读。
  • readConcern 如何实现安全的读写分离
  • 考虑如下场景:
  • 向主节点写入一条数据,立即在从节点读取这条数据。
  • 错误方式:
db.orders.insert({old:101,sku:"kite",q:1})
db.orders.find({old:101}).readPref("secondary")
  • 正确方式:writeConcern + readConcern majority 来解决:
db.orders.insert({old:101,sku:"kite",q:1}, {writeConcern:{w:"majority"}})
db.orders.find({old:101}).readPref("secondary").readConcern("majority")
  • 小测试
  • readConcern 主要关注读的隔离性,ACID 中的 Isolation,但是是分布式数据库特有的概念。
  • readConcern:"majority" 相应于事务中隔离级别中的 Read Committed。
  • readConcern:"linearizable" 略
  • readConcern:"snapshot"
  • 只在多文档事务中生效。
  • 讲一个事务的 readConcern 设置为 snapshot,将保证在事务中的读:
  • 不出现脏读;
  • 不出现不可重读;
  • 不出现幻读。
  • 因为所有的读都将使用同一个快照,直到事务提交为止该快照才被释放。