【摘要】

MongoDB 在进行分组统计时如果面对一些比较复杂的计算情况,往往会遇到 shell 脚本过于复杂的问题。而集算器 SPL 语言,则因其有丰富的函数库及易用性恰好能弥补 Mongo 这方面的不足。若想了解更多,请前往乾学院:MongoDB 分组统计!

MongoDB 作为 NoSql 文档型数据库,在全球范围得到广泛的支持与应用。在比较常用的数据库功能中,相对于普通的增删改查,使用 group 聚合分组统计有些复杂,而 MongoDB 也给予了支持。本文将对MongoDb分组的实现方法及示例进行分析,通过在 MongoDB 脚本中操作、使用集算器 SPL 语言操作两种操作途径,进行简单的归纳总结。具体的问题场景包括以下几个方面:

1. 内嵌数组结构的统计

2. 内嵌文档求和

3. 分段分组结构统计

4. 多字段分组统计

1. 内嵌数组结构的统计

对嵌套数组结构中的数据进行统计处理例如查询考试科目的平均分及每个学生的总成绩:

测试数据:




mongodb lookup 分组统计 mongodb分组统计 性能_数组


期待统计结果:


mongodb lookup 分组统计 mongodb分组统计 性能_mongodb lookup 分组统计_02


Mongodb脚本:


mongodb lookup 分组统计 mongodb分组统计 性能_数组_03


由于各科分数 scroe 是按课目、成绩记录的数组结构,统计前需要将它拆解,将每科成绩与学生对应,然后再实现分组计算。这需要熟悉 unwind 与 group 组合的应用。

SPL 脚本 (student.dfx):


mongodb lookup 分组统计 mongodb分组统计 性能_数据_04


按课目统计的总分数:


mongodb lookup 分组统计 mongodb分组统计 性能_mongodb lookup 分组统计_05


每个学生的总成绩:


mongodb lookup 分组统计 mongodb分组统计 性能_嵌套_06


脚本说明:

A1:连接 mongodb 数据库。

A2:获取 student 表中的数据。

A3:将 scroe 数据合并成序表,再按课程分组,计算平均分。

A4:统计每个学生的成绩后返回列名为 NAME、TOTAL 的序表。new 函数表示生成新序表。

A5:关闭数据库连接。

这个嵌套结构统计的例子比较常见,相信很多人都遇到过,需要先拆解再分组计算,主要是熟悉 mongodb 对嵌套数据结构的处理。

2. 内嵌文档求和

对内嵌文档中的数据求和处理, 例如统计下面每条记录中 income,output 的数量和。

测试数据:


mongodb lookup 分组统计 mongodb分组统计 性能_数组_07


期待统计结果:


mongodb lookup 分组统计 mongodb分组统计 性能_数组_08


Mongodb脚本:

var fields = [ "income