1、简单介绍
capped collections 是性能出色的有着固定大小的集合,以LRU(Least Recently Used 最近最少使用)规则和插入顺序进行age-out(老化移出)处理,自动维护集合中对象的插入顺序,在创建时要预先指定大小。如果空间用完,新添加的对象将会取代集合中最旧的对象。
2、功能特点
可以插入及更新,但更新不能超出collection 的大小,否则更新失败。不允许删除,但是可以调用drop() 删除集合中的所有行,但是drop 后需要显式地重建集合。在32 位机上,一个capped collection 的最大值约为482.5M,64 位上只受系统文件大小的限制。
3、常见用处
(1)logging
MongoDB 中日志机制的首选,MongoDB 没有使用日志文件,而是把日志事件存储在数据库中。在一个没有索引的capped collection 中插入对象的速度与在文件系统中记录日志的速度相当。
(2)cache
缓存一些对象在数据库中,比如计算出来的统计信息。这样的需要在collection 上建立一个索引,因为使用缓存往往是读比写多。
(3)auto archiving
可以利用capped collection 的age-out 特性,省去了写cron 脚本进行人工归档的工作。
4、推荐用法
(1)为了发挥capped collection 的最大性能,如果写比读多,最好不要在上面建索引,否则插入速度从"log speed"降为"database speed"。
(2)使用"nature ordering"可以有效地检索最近插入的元素,因为capped collection 能够保证自然排序就是插入时的顺序,类似于log 文件上的tail 操作。
5、注意事项
(1)可以在创建capped collection 时指定collection 中能够存放的最大文档数。但这时也要指定size,因为总是先检查size 后检查maxRowNumber。可以使用validate()查看一个collection已经使用了多少空间,从而决定size 设为多大,单位字节。如:
db.createCollection("student", {capped:true, size:100000, max:100});
db.student.validate();max=1 时会往collection 中存放尽量多的documents。
(2)上述的createCollection 函数也可以用来创建一般的collection , 还有一个参数"autoIndexID",值可以为"true"和"false"来决定是否需要在"_id"字段上自动创建索引,如:
db.createCollection("student", {size:10000000, autoIndexId:false})。
默认情况下对一般的collection 是创建索引的,但不会对capped collection 创建。
6、Capped Collection实际应用
MongoDB 支持 Capped Collection,一种固定大小的集合,当集合的大小达到指定大小时,新数据覆盖老数据,MongoDB Replica set 中的 oplog 就是 Capped Collection 类型。
1)查看 oplog 是否是 Capped Collection
> db.student.isCapped();
true
备注:通过 db.collection.isCapped()命令可以查看一个集合是否是 Capped Collection 。
Capped Collection 具有以下特性,在使用的时候需要注意:
*不可以对 Capped Collection 进行分片。
*在 2.2 版本以后,创建的Capped Collection 默认在 _id 字段上创建索引,而在 2.2 版本或以前没有。
*在 Capped Collection 插入文档后可以进行更新(update)操作,当更新不能导致原来文档占用空间增长,否则更新失败。
*不可以对 capped collection 执行删除文档操作,但可以删除整个集合。
2)创建 Capped Collection
> db.createCollection("mycoll1",{capped:true,size:1024});
{
"ok": 1,
"$gleStats": {
"lastOpTime": {
"t": 1426665956000,
"i": 1
},
"electionId": ObjectId("5508de2cd812466ec2804cc9")
}
}
备注:通过 db.createCollection 命令创建 Capped Collection 集合,创建时必须指定集合大小,用于预先分配空间。
3)查看一个集合是否是 Capped Collection
可以通过以下两种方法查看一个集合是否是 Capped Collection 。
> db.mycoll1.isCapped();
> db.mycoll1.stats();
{
"sharded": false,
"primary": "shard_a",
"ns": "test.mycoll1",
"count": 0,
"size": 0,
"storageSize": 4096,
"numExtents": 1,
"nindexes": 1,
"lastExtentSize": 4096,
"paddingFactor": 1,
"systemFlags": 1,
"userFlags": 0,
"totalIndexSize": 8176,
"indexSizes": {
"_id_": 8176
},
"capped": true,
"max": NumberLong("9223372036854775807"),
"ok": 1,
"$gleStats": {
"lastOpTime": {
"t": 1426665956000,
"i": 1
},
"electionId": ObjectId("5508de2cd812466ec2804cc9")
}
}
备注:"capped" 属性为 true 表示是 Capped Collection 。
4)测试:插入记录
> for (var i = 1; i <= 10000; i++) db.mycoll1.save({id : i, name : 'francs'});
> db.mycoll1.find().count();
56
备注:由于限制了集合大小不小,目标插入 10000 条,结果只插入了 56 条数据,并且老数据被新数据覆盖。另外不可以删除 Capped Collection 的文档
5)测试: 删除 capped collection 中的文档
> db.mycoll1.remove({id:9956});
canot remove from a capped collection
备注:删除文档时抛出异常。
6)测试:更新 capped collection 中的文档
> db.mycoll1.find({id:9956});
{ "_id" : ObjectId("550932943b42e8050fa8ae7a"), "id" : 9956, "name" : "francs" }
> db.mycoll1.update({id:9956},{$set:{name:'aaa_francs'}});
failing update: objects in a capped ns cannot grow
> db.mycoll1.update({id:9956},{$set:{name:'bbb'}});
> db.mycoll1.find({id:9956});
{ "_id" : ObjectId("550932943b42e8050fa8ae7a"), "id" : 9956, "name" : "bbb" }
备注:这里正好验证了特性3,更新后的值不能超过原有空间,否则更新失败。