本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。

首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。

Tip#7.Pre-populate anything you can

预先填充你能填充的

如果你知道,在将来,你的文档中肯定会需要一些字段,在你插入文档的时候就填充它们,而不是在需要它们的时候在创建,会更高效。例如,你正在创建一个站点分析的应用,可以查看一天中有每一页都有多少用户访问。你会有一个pages collection,每个document记录在过去的6个小时中,每分钟和每小时的访问量。

 

  1.   "_id":pageId, 
  2.   "start":time, 
  3.   "visits":{ 
  4.     "minutes":[ 
  5.       [num0,num1,...,num59], 
  6.       [num0,num1,...,num59], 
  7.       [num0,num1,...,num59], 
  8.       [num0,num1,...,num59], 
  9.       [num0,num1,...,num59], 
  10.       [num0,num1,...,num59] 
  11.     ], 
  12.     "hours":[num0,num1,...,num5] 
  13.   } 

 

这么做有一个优势,就是我们知道从现在到某一个时间点文档会是什么样子。是一个从现在开始,在接下来的6个小时,每分钟和每小时的访问量。后面的6个小时又会是一个新的文档。

因此,我们需要一个批量处理的任务,在空闲的时候,或者是在一天的固定时间,插入这些模板文档。插入的模板应该是下面的样子。

 

  1.   "_id":pageId, 
  2.   "start":someTime, 
  3.   "visits":{ 
  4.     "minutes":[ 
  5.       [0,0,...,0], 
  6.       [0,0,...,0],
  7.       [0,0,...,0], 
  8.       [0,0,...,0], 
  9.       [0,0,...,0], 
  10.       [0,0,...,0] 
  11.     ], 
  12.     "hours":[0,0,0,0,0] 
  13.   } 

现在,当你增加这些计数器的时候,mongodb不需要为他们现去分配空间。只是更新已经插入的文档的值,这么做速度会更快。

例如,在刚开始的一个小时,你只需要这么做。

 

  1. db.page.update({"_id":pageId,"start":thisHour},{"$inc":{"visits.0.0":3}}) 

这种做法也可以扩展到集合和数据库的其他类型数据,如果你每天需要一个新的集合,最好预先创建他们。