Rdfind介绍

Rdfind,意即 redundant data find(冗余数据查找),是一个通过访问目录和子目录来找出重复文件的自由开源的工具.它是基于文件内容而不是文件名来比较.

Rdfind 使用排序算法来区分原始文件和重复文件.如果你有两个或者更多的相同文件,Rdfind 会很智能的找到原始文件并认定剩下的文件为重复文件.一旦找到副本文件,它会向你报告.你可以决定是删除还是使用硬链接或者符号(软)链接代替它们.

安装



sudo apt install rdfind



Shell


Copy


处理效果

删除重复文件,而不是使用硬链接或软链接代替它们。



rdfind -deleteduplicates true /media/faonecze/资料存档/



Shell


Copy


这样已满的盘符又清理出几GB的空间 Rdfind清理重复存档文件_生成日志

实例图片:

Rdfind清理重复存档文件_符号链接_02

Rdfind清理重复存档文件_生成日志_03

并生成日志,存于用户更目录下名为​​results.txt​​,当然如果不嫌麻烦也可以通过​​results.txt​​文件手动删除重复内容.

Rdfind清理重复存档文件_子目录_04

扩展内容

在不修改其他事情情况下使用 -dryrun 选项找出所有重复文件,并在终端上输出汇总信息.



rdfind -dryrun true /media/faonecze/资料存档/



Shell


Copy


使用硬链接代替所有重复文件,运行:



rdfind -makehardlinks true /media/faonecze/资料存档/



Shell


Copy


使用符号链接/软链接代替所有重复文件,运行:



rdfind -makesymlinks true /media/faonecze/资料存档/



Shell


Copy


目录中有些空文件,也许你想忽略他们,使用 -ignoreempty 选项:



rdfind -ignoreempty true /media/faonecze/资料存档/



Shell


Copy


不再想要这些旧文件,删除重复文件,而不是使用硬链接或软链接代替它们.只删除重复文件,就运行:



rdfind -deleteduplicates true /media/faonecze/资料存档/



Shell


Copy


不想忽略空文件,并且和重复文件一起删除,运行:



rdfind -deleteduplicates true -ignoreempty false /media/faonecze/资料存档/



Shell


Copy