纯手打,只是总结了通过多种方式查看mongodb的内存使用情况,并没能提出有效的减少mongodb的内存的方法。


都说mongodb吃内存比较厉害,确实很厉害,我的数据级别到达了 4千万,数据量大概是140G,几天下来的话,130G的内存盘,到了60%,没有找到很好的办法前,每次都是重启mongodb,新手,我也不太清楚这个数据量是处于一个怎样的位置,有怎样的优良的解决办法,知道的麻烦告知一下,跪谢。


为啥这么吃内存呢,mongodb使用的是内存映射存储引擎,即Memory Mapped Storage Engine,简称MMAP,MMAP可以把磁盘文件的一部分或全部内容直接映射到内存,这样文件中的信息位置就会在内存中有对应的地址空间,把磁盘IO操作转换成内存操作,

但坏处是你没有方法很方便的控制MongoDB占多大内存,事实上MongoDB会占用所有能用的内存,所以最好不要把别的服务和MongoDB放一起。之所以会有这个总结,就是因为曾经将web服务与mongodb放在一起,导致负载间歇性的剧增,web服务直接被服务器自动重启了,当然这是后话。


如果想知道mongodb的内存使用情况,可以有一些几个操作:

  1. top

mongodb脏数据 mongodb 数据量_数据

shift+m,如果不出意外的话,mongodb应该居于首位了,

VIRT:虚拟内存

RES:实际使用内存

%MEM:内存使用比

刚重启过,内存占用还不算多



2.mongostat

mongodb脏数据 mongodb 数据量_python_02

mapped:映射到内存的数据大小,

vsize:虚拟内存,是mapped的2倍

res: 实际使用的内存,如果res经常突然下降,去查查是否有别的程序狂吃内存

conn:当前的连接数

这里的vsize,res与top的一致,conn如果一直都很高的话,也是有问题的,lockedb如果很高的话(经常超过),说明有问题很大了,曾经因为很多python脚本规定时间跑不完,导致连接一个接着一个,最终lockdb到了50% 


3.db.stats()

mongodb脏数据 mongodb 数据量_mongodb_03

db:当前数据库

collections:当前数据多少张表

objects:当前数据库所有表多少条数据

dataSize:所有数据的总大小

storageSize:所有数据占的磁盘大小

indexes:索引数

indexSize:索引大小

fileSize:预分配给数据库的文件大小


其实这个并不能说显示内存的什么情况,只能说能显示整个数据库的一个状态status



4.db.serverStatus()

mongodb脏数据 mongodb 数据量_数据_04



这个命令在单独的个别db中,并不能显示出任何结果,需要在admin 这个db中才有效,测试可以看到很多信息显示,如connections,current为当前的连接,available为可用的连接

我们常用的话,不会显示这么多的信息,一般需要什么就显示什么。如内存使用情况


5.db.serverStatus().mem

mongodb脏数据 mongodb 数据量_python_05

virtual:虚拟内存的大小

mapped:映射到内存的数据大小


这里虚拟内存是mapped的两倍,是因为我们开启了Journal日志,需要在内存中多映射一次,大概就是它的两倍了。如果关闭Journal日志,虚拟内存大小将和mapped大小相当


我常用的大概就是top和mongostat,每次看到内存比较大的时候,采用的办法就是重启服务,但是这并不能解决问题,只是暂缓问题,有解决办法的麻烦告知一声,跪谢。