通过本例还可以学到:os、glob、shutil三个标准库的综合运用,现在让我们一起来捋一捋实现的逻辑。

首先是导入需要的库

import

os库可以完成操作系统层面大量操作,例如文件夹的创建、移动、重命名、删除等,有些功能实现的不是很完美,就用到shutil库跟其互补了,例如文件的复制、移动等。glob库可以利用通配符进行文件的搜索获取,非常强大

# 设置建立分类总文件夹的路径,这里按自己的实际路径修改
mkdir_path = r'C:Userschenx文件夹分类'
# 设置需要遍历整理的文件夹路径,可以依据自己的实际需求修改
goal_dir = r'C:xxxxxxxx)'

if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)

os.mkdir可以在指定路径创建文件夹,但如果文件夹已经存在则会报错,因此谨慎一点可以利用os.path.exists先对文件夹的存在与否进行判断,接下来是代码核心循环,为了方便理解先简化成如下形式:

for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        print(file)

glob.glob(f'{goal_dir}/**/*', recursive=True)中**/*是通配符的重要用法,*可以代表任意个字符,包括0个字符,recursive参数的设置确保遍历。由于需要找出所有的文件而非文件夹,这里用os.path.isfile进行判断。最后可以输出文件的绝对路径先看看代码有没出现错误,让我们继续往下写

for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'

这里发生了什么呢?确认遍历到的是文件后,先用os.path.basename获取绝对路径中的文件名,接下来就是获取后缀名了。可以简单用split根据.将字符串“劈开”,然后取最后一个元素就是后缀名了,但注意这里必须要考虑一个特殊情况:有些文件没有后缀名(文件类型就叫 文件),且名字中也没有.,这时用字符串方法split就会报错。如下图:

python处理后缀相同文件_文件名

因此需要先判断文件中有没有.。由于我们是利用后缀名建立文件夹,所以索性将文件名中没有.的 文件 类型统一分类到others文件夹了,(这个实现逻辑大致上没有问题,但是依然忽略了一种极端情况:有些文件没有后缀名,且文件名中有个.,哈哈哈哈这种就会被上面的实现逻辑拆解出错误的后缀名了。更好的方法是有个函数可以直接获取文件的后缀名,利用这个对文件进行分类,感兴趣的读者可以自己尝试),接下来就可以根据后缀名产生文件夹了,这里依然要注意先判断文件夹是否已经产生

for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'
        if not os.path.exists(f'{mkdir_path}/{suffix}'):
            os.mkdir(f'{mkdir_path}/{suffix}')
        shutil.copy(file, f'{mkdir_path}/{suffix}')

为了避免移动文件夹而造成的异常,尤其是系统盘,因此这里用的是复制。按照需要也可以换成shutil.move最后我们可以加上分类文件夹和所有文件的计数并输出。完整代码如下,拿走就能用!

import os
import shutil
import glob

mkdir_path = r'C:Userschenx文件夹分类'
goal_dir = r'C:xxxxxxxx'

if not os.path.exists(mkdir_path):
    os.mkdir(mkdir_path)

file_num = 0
dir_num = 0

for file in glob.glob(f'{goal_dir}/**/*', recursive=True):
    if os.path.isfile(file):
        filename = os.path.basename(file)
        if '.' in filename:
            suffix = filename.split('.')[-1]
        else:
            suffix = 'others'
        if not os.path.exists(f'{mkdir_path}/{suffix}'):
            os.mkdir(f'{mkdir_path}/{suffix}')
            dir_num += 1
        shutil.copy(file, f'{mkdir_path}/{suffix}')
        file_num += 1

print(f'整理完成,有{file_num}个文件分类到了{dir_num}个文件夹中')