连接
标准 URI 连接语法
通常,可以设定标准的 URI 连接语法,作为连接配置:
mongodb://[username:password@]host1[:port1][,host2[:port2],...[,hostN[:portN]]][/[database][?options]]
mongodb://
: 固定的格式,即指定当前的 URI 是标准的 MongoDB 连接语法
-
username:password@
: 可选项,如果设置,在连接数据库服务器之后,驱动会尝试登录这个数据库 -
host1
: 必须的,至少指定一个 host,它指定了要连接服务器的地址。如果要连接副本及集,需要指定多个主机地址 -
portX
: 可选的指定端口,如果不填,默认为27017
-
/database
: 如果指定账号和密码,连接并验证登录指定数据库。若不指定,默认打开 test 数据库 -
?options
: 连接选项,如果没有指定数据库,则前面需要加上/
。所有连接选项都是键值对name=value
,键值对之间通过&
或;
隔开
连接选项
标准的连接格式包含了多个选项,如下所示:
-
replicaSet=name
: 验证副本集的名称 slaveOk=true|false
: 选择连接主服务器的方式
-
true
: 表示有从服务器,当connect=direct
时会连接第一台机器,即使这台不是主服务器;当connect=replicaSet
时会发送所有的写请求到主并且把读请求分布在其他从服务器 -
false
: 表示无从服务器,当connect=direct
时会自动找寻主服务器;当connect=replicaSet
时仅连接主服务器,并且所有的读写命令都连接到主服务器
-
safe=true|false
: 设置为true
时,在执行更新操作之后,驱动都会发送getLastError
命令来确保更新成功 -
w=n
: 驱动添加{w: n}
到getLastError
命令,应用于safe=true
-
wtimeoutMS=ms
: 驱动添加{wtimeout: ms}
到getLastError
命令,应用于safe=true
-
fsync=true|false
: 驱动添加{fsync: true}
到getLastError
命令,应用于safe=true
-
journal=true|false
: 如果设置为true
,同步到日志(在提交到数据库前写入到实体中),应用于safe=true
-
connectTimeoutMS=ms
: 可以打开连接的时间 -
socketTimeoutMS=ms
: 发送和接受 socket 的时间
连接命令格式
使用 mongosh 连接 MongoDB 时,也支持命令选项的方式添加配置:
-
--host arg
: 指定数据库地址 -
--port arg
: 指定数据库端口 -
-u [ --username ] arg
: 鉴权的账号 -
-p [ --password ] arg
: 鉴权的密码
插入文档
插入校验
MongoDB 会对要插入的数据进行最基本的检查:检查文档的基本结构,如缺少 _id
键会自动添加一个、是否包含非 UTF-8 字符、是否使用了无法识别的类型、检查文档大小等。
其中,检查文档大小主要因为 MongoDB 限制了所有文档必须小于 16MB,主要是为了防止不良的模式设计并确保性能上的一致。
要查看文档的 BSON 大小,可以在 shell 中执行 Object.bsonsize(doc)
查看字节大小。
单个插入
官方文档:db.collection.insertOne() — MongoDB Manual
db.collection.insertOne(
<document>,
{
writeConcern: <document>
}
)
批量插入
db.collection.insertMany(
[ <document 1> , <document 2>, ... ],
{
writeConcern: <document>,
ordered: <boolean>
}
)
通过传输 ordered=true
可以确保文档按提供的顺序插入,指定为 false
则允许 MongoDB 重新排列插入的顺序以提高性能,默认为 true
值。
以有序插入的方式使用 insertMany
出现错误将会阻塞后续的插入动作,无需插入的方式则不管其他插入是否出现了错误。
删除文档
单个删除
db.collection.deleteOne(
<filter>,
{
writeConcern: <document>,
collation: <document>,
hint: <document|string> // Available starting in MongoDB 4.4
}
)
使用 hint
参数可以指定 filter
查询时命中的索引,这对于复杂的索引结构时可以提升部分效率。
批量删除
db.collection.deleteMany(
<filter>,
{
writeConcern: <document>,
collation: <document>,
hint: <document|string> // Available starting in MongoDB 4.4
}
)
单个删除并返回
db.collection.findOneAndDelete(
<filter>,
{
writeConcern: <document>,
projection: <document>,
sort: <document>,
maxTimeMS: <number>,
collation: <document>
}
)
更新文档
更新文档是原子操作:如果两个更新同时发生,那么首先到达服务器的更新会先被执行,然后再执行下一个更新。
因此,相互冲突的更新可以安全地迅速接连完成,而不会破坏任何文档:最后一次更新将“成功”。如果不想使用默认行为,则可以考虑使用文档版本控制模式。
单个更新
db.collection.updateOne(
<filter>,
<update>,
{
upsert: <boolean>,
writeConcern: <document>,
collation: <document>,
arrayFilters: [ <filterdocument1>, ... ],
hint: <document|string> // Available starting in MongoDB 4.2.1
}
)
在更新文档的时候,比较需要注意的事 upsert
的使用,其是一种特殊类型的更新:如果找不到与筛选条件相匹配的文档,则会以这个条件和更新文档为基础来创建一个新文档;如果找到了匹配的文档,则进行正常的更新。
因此,使用 upsert
的好处就是,可以使用同一套代码创建和更新文档。
使用 upsert
时就涉及到一个 $setOnInsert
运算符,它的作用是,只会在插入文档时设置字段的值,在后续的更新时不对其进行更改。
批量更新
db.collection.updateMany(
<filter>,
<update>,
{
upsert: <boolean>,
writeConcern: <document>,
collation: <document>,
arrayFilters: [ <filterdocument1>, ... ],
hint: <document|string> // Available starting in MongoDB 4.2.1
}
)
单个替换
db.collection.replaceOne(
<filter>,
<replacement>,
{
upsert: <boolean>,
writeConcern: <document>,
collation: <document>,
hint: <document|string> // Available starting in 4.2.1
}
)
replaceOne
和 updateOne
操作的区别在于,updateOne
可以更新文档中部分键的值,而 replaceOne
的作用是直接将整个文档都替换掉,通常是建议使用 updateOne
而不是 replaceOne
。
单个更新并返回
db.collection.findOneAndUpdate(
<filter>,
<update document or aggregation pipeline>, // Changed in MongoDB 4.2
{
projection: <document>,
sort: <document>,
maxTimeMS: <number>,
upsert: <boolean>,
returnDocument: <string>,
returnNewDocument: <boolean>,
collation: <document>,
arrayFilters: [ <filterdocument1>, ... ]
}
)
使用 findOneAndUpdate
而不是 updateOne
的最大目的莫过于使用 findOneAndUpdate
可以返回更新前后文档内容。
通过设置 returnNewDocument
的值为 true
可以返回更新后的文档,为 false
时可以返回更新前的文档。
单个替换并返回
db.collection.findOneAndReplace(
<filter>,
<replacement>,
{
projection: <document>,
sort: <document>,
maxTimeMS: <number>,
upsert: <boolean>,
returnDocument: <string>,
returnNewDocument: <boolean>,
collation: <document>
}
)
更新运算符
对于如 updateOne
、updateMany
、findOneAndUpdate
等更新操作,MongoDB 提供了原子的更新运算符支持只更新部分数据。
运算符支持以 { <operator>: { <field>: <value>,... } }
的方式使用,并且可以同时使用多个运算符。
为避免出现歧义,不建议对同一个属性同时使用不同的运算符。
字段
-
$currentDate
: 将指定键设置为当前时间 -
$inc
: 对数字类型的键做递增操作 -
$min
: 会比较原始值和更新值,并设置成较小值 -
$max
: 会比较原始值和更新值,并设置成较大值 -
$mul
: 对数字类型的键做乘法操作 -
$rename
: 修改指定键的名称 -
$set
: 将指定键设置为指定值 -
$setOnInsert
: 与upsert
配合使用,如果更新导致文档插入,则设置字段的值,对修改现有文档的更新操作无效 -
$unset
: 删除指定键
数组
-
$
: 充当占位符,更新与查询条件匹配的第一个元素 -
$[]
: 充当占位符,为匹配查询条件的文档更新数组中的所有元素 -
$[<identifier>]
: 充当占位符,为匹配查询条件的文档更新与arrayFilters
条件匹配的所有元素 -
$addToSet
: 仅当集合中不存在该元素时,才将元素添加到数组中 -
$pop
: 传{ $pop: { field: 1 } }
表示删除数组中的最后一项,传-1
时表示删除第一项 -
$pull
: 删除与指定查询匹配的所有数组元素 -
$push
: 新增一项到数组中 -
$pullAll
: 删除列出的所有数组元素
数组内层
-
$each
: 使用$push
或$addToSet
运算符时,增加此运算符可以批量添加元素 -
$position
: 与$each
配合使用,可以指定添加元素的位置 -
$slice
: 与$each
配合使用,防止数组的增长超过某个大小,传正数表示从左到右截断 -
$sort
: 与$each
配合使用,对添加完元素的数组进行排序
位运算
$bit
: 支持对整数值进行按位 AND
、OR
或 XOR
更新,通过使用 { $bit: { <field>: { <and|or|xor>: <int> } } }
完成更新。
批量写操作
MongoDB 提供了 bulkwrite
命令支持批量执行命令,批处理时在一定程度上减少了网络交互的损耗。
db.collection.bulkWrite(
[ <operation 1>, <operation 2>, ... ],
{
writeConcern: <document>,
ordered: <boolean>
}
)
支持的以下操作:
insertOne
updateOne
updateMany
replaceOne
deleteOne
deleteMany
查询文档
单个查询
db.collection.findOne(query, projection, options)
第一个参数是查询条件,可以使用键值对的方式指定需要匹配的条件,多个键之间是 AND
的关系。
第二个参数用于仅返回指定的键,既可以节省网络传输的数据量,也可以减少客户端解码文档的时间和内存消耗。
第三个参数可以指定查询到可选项,这些选项会修改查询行为和返回结果的方式。
批量查询
db.collection.find(query, projection, options)
数据库会使用游标返回 find
的执行结果。
对于游标,客户端可以限制结果的数量,跳过一些结果,按任意方向的任意键组合对结果进行排序等操作。
下述是一些常用的游标方法:
-
count()
: 统计游标引用的文档数量 -
hasNext()
: 查询是否有下一个结果 -
hint(index)
: 指定游标命中的索引 -
limit(number)
: 限制返回结果的数量 -
next()
: 返回下一个搜索结果 -
size()
: 返回应用skip()
和limit()
之后的查询数量 -
skip(number)
: 控制跳过一定的数量,跳过大量数据会比较慢 -
sort(sort)
: 使用键值对的方式对搜索结果进行排序
在服务器端,游标会占用内存的资源。通常在以下情况会终止游标及进行随后的清理:
- 当游标遍历完成匹配的结果时,它会清除自身
- 当游标超出客户端的作用域时,驱动程序会向数据库发送终止游标的信号
- 当游标达到 10 分钟没有使用时,数据库游标会被自动销毁
查询运算符
同样的,设置查询条件时,MongoDB 提供了查询运算符支持更多的查询方式。
比较运算符
-
$eq
: 返回等于指定值的结果,等同{ <field>: <value> }
的显式表示 -
$gt
: 返回大于指定值的结果 -
$gte
: 返回大于等于指定值的结果 -
$in
: 返回等于指定数组中任意一个值的结果,对于一个键匹配多个值,$in
比$or
更方便 -
$lt
: 返回小于指定值的结果 -
$lte
: 返回小于等于指定值的结果 -
$ne
: 返回不等于指定值的结果 -
$nin
: 返回不等于指定数组中任意一个值的结果
逻辑运算符
-
$and
: 返回同时符合查询子句要求的结果 -
$not
: 元运算符,匹配不符合查询语句要求的结果 -
$nor
: 返回不能同时符合查询子句要求的结果 -
$or
: 返回与任意一个查询子句的条件匹配的结果
对于普通的 $and
类型查询,我们总是希望尽可能用最少的参数来限定结果的范围。而 $or
类型查询则相反,如果第一个参数能够匹配尽可能多的文档,则其效率最高。
元素运算符
-
$exists
: 判断指定键是否存在,返回符合要求的结果 -
$type
: 判断指定键的数据类型,返回符合要求的结果(好的模式设计不应该出现不同类型)
表达式运算符
-
$expr
: 允许使用聚合表达式,适合用在一些比较复杂的查询语句 -
$jsonSchema
: 根据给定的 JSON 模式验证文档,返回符合要求的结果 -
$mod
: 指定键的值执行模运算,返回符合要求的结果 -
$regex
: 使用正则表达式对指定键做匹配,MongoDB 可以利用索引来查询前缀正则表达式,但不能用于不区分大小写的搜索 -
$text
: 对使用文本索引的字段内容执行文本搜索,可以作为一个简易的搜索引擎使用 -
$where
: 允许在查询时执行任意 JavaScript 代码(性能较差,尽可能使用$expr
代替)
数组运算符
-
$all
: 匹配包含查询中指定的所有元素的数组 -
$elemMatch
: 用于强制将查询子句与单个数组元素进行匹配 -
$size
: 匹配指定数组长度大小的结果
投影运算符
投影运算符针对的是查询语句的第二个参数,即返回的结果。
-
$
: 仅返回数组中与查询条件匹配的第一个元素 -
$elemMatch
: 对返回结果中的数组元素做$elemMatch
匹配,仅返回数组中满足要求的元素 -
$meta
: 与$text
运算符配合使用,返回与文档关联的元数据,可以返回匹配分数,或者索引键 -
$slice
: 对返回结果中的数组做截取返回
特殊的 null 值
在 MongoDB 中,null
是一个比较特殊的值,它可以与自身匹配。也就是说了,通过 { field: null }
可以查询出 field
键为 null
的文档。
不过,更特殊的是,null
同样会匹配缺少这个键值的文档。也就是说,{ field: null }
可以查询出不包含 field
键的文档。
如果仅想匹配键值为 null
的文档,则需要检查该键的值是否为 null
,并且通过 $exists
条件确认该键已存在,如 { field: { $eq: null, $exists: true } }
就是这样的查询条件组。