前序:


由于业务原因,需要将过期数据删除,之前也已经写了一篇关于如何定期删除数据的文章,但有一个问题出现了,


频繁删除数据之后,会产生很多磁盘碎片,这些碎片如果没有被重复利用,进而会影响查询性能(表查询时仍然会扫描这部分删除数据的磁盘空间块),随需要处理之
当从MongoDB中删除文档(Documents)或集合(Collections)后,MongoDB不会将Disk空间释放给OS,MongoDB在数据文件(Data Files)中维护Empty Records的列表。当重新插入数据后,MongoDB从Empty Records列表中分配存储空间给新的Document,因此,不需要重新开辟空间。为了更新有效的重用Disk空间,必须重新整理数据碎片。


有好几种方法处理:


①使用compact命令


②重建collection


③新加一个secondary节点,然后将此节点切换为primary(数据量非常大的情况下,为了不影响业务)


后两种方法以后有时间再细说,也是网友提供的,今天只看Compact命令的实现



简介:


     官方解释是:compact命令能够重写和重组集合的data和index


     格式:      


,force:<boolen>


     compact命令之后写你想要整理的collection名字


     force参数用于replica set中primary整理时之用,否则会报错


说明:


          在compact期间会阻塞其他针对此collection的操作,所以最好在业务不繁忙的时候进行compact动作;


          针对compact完成之后,不同引擎会有不同的磁盘影响


     WireTiger引擎:


          在此引擎的数据库下,compact会整理碎片,并且释放未使用的磁盘空间给系统


     MMAPv1引擎:


          在此引擎的数据库下,compact会整理碎片,重建索引,但不会将未使用的空间释放给系统,后续新插入的数据依然可以使用这些空间


     在复制集架构下的一些注意:


          compact命令不会自动复制到secondary节点执行,compact在每个节点成员中都是独立的,在Primary,secondary中执行时都要使用force参数,


          当在secondary的collection上执行compact命令时,此secondary节点会变成RECOVERING状态,且无法提供读操作


     在capped collection中不必使用compact命令,因为它本身就是固定空间


测试验证:


     在单实例情况下:


    

mongoDb corn清理数据 mongodb数据删除后产生碎片_删除数据



     


     在复制集架构primary上使用时,如果不使用force参数,则会报错,如下:

    

mongoDb corn清理数据 mongodb数据删除后产生碎片_数据库_02



若想要对着一个数据库的所有collection集合进行compact命令的话,可以参考使用repairDatabase命令哦

>use testDB

>db.runCommand({repairDatabase:1})

注:这个命令一定要谨慎使用,能不用的情况下尽量不用,因为会花费很多时间和性能

官网的一句话是这样说的:

The  repairDatabase command compacts all collections in the database. It is identical to running the compact command on each collection individually