最近在做项目中,要使用python,对文件拷贝有了一些了解,这里将自己理解的文件拷贝整理出来。

    如下所示,文件拷贝思路:

python 文件拷贝并覆盖 python拷贝整个文件夹_python 文件 拷贝

     文件拷贝,从io上来说就是读文件,写文件到另一个指定的地方。

     拷贝,还有一个小细节,就是写入文件的路径,这个路径,目标文件夹后面的部分其实和源文件相同,只是src前面与dst前面不同,可以考虑通过字符串替换的方式将不同的部分替换。

    总结一下拷贝思路就是:遍历源文件夹,遇到文件就读取并写入新文件,遇到文件夹,则把新文件夹路径作为源文件夹继续递归调用本方法。

    下面给出一个示例:

#!/usr/bin/python
# -*- coding:utf-8 -*-
import os

'''
  src - 123.txt
      - 123
         |  - 123.txt
      - 234
         |  - 234.txt
最终达到的效果:            
  dst - 123.txt
      - 123
         |  - 123.txt
      - 234
         |  - 234.txt   
'''


def copy_dir(src, dst):
    if not os.path.exists(src):
        return
    # 目标文件夹可能不存在,这个时候需要创建
    if not os.path.exists(dst):
        os.mkdir(dst)
    pathes = os.listdir(src)
    for p in pathes:
        f_path = os.path.join(src, p)
        # 目标路径作替换 src/123.txt -> dst/123.txt
        dst_path = f_path.replace(src, dst)
        if os.path.isdir(f_path):
            # 目标目录按照源文件夹层级生成 src/234 -> dst/234
            if not os.path.exists(dst_path):
                os.mkdir(dst_path)
            # 递归调用拷贝方法
            copy_dir(f_path, dst_path)
        else:
            with open(f_path, 'rb') as f:
                content = f.read()
                with open(dst_path, 'wb') as wf:
                    wf.write(content)


def run():
    copy_dir('src', 'dst')


if __name__ == '__main__':
    run()

    运行效果:

python 文件拷贝并覆盖 python拷贝整个文件夹_copy_02

    运行开始之前,没有dst目录,运行代码之后,生成了一个dst目录,目录中的层级结构和src一致。 

    python拷贝文件介绍完了,一般我们看到的示例,都是通过shutil来进行拷贝:

    针对上述的示例,我们通过shutil.copytree('src','dst')就可以搞定。

#!/usr/bin/python
import shutil


def run():
    shutil.copytree('src', 'dst')


if __name__ == '__main__':
    run()

    运行效果:

python 文件拷贝并覆盖 python拷贝整个文件夹_python 文件 拷贝_03

    而我们通过查看shutil.copytree的代码,可以看到这样的源码:

    copytree() -> _copytree()

python 文件拷贝并覆盖 python拷贝整个文件夹_read_04

    copy_function() 一般指定的是copy2,而copy2里面调用了copyfile(),copyfile()调用了copyfileobj:

python 文件拷贝并覆盖 python拷贝整个文件夹_python_05

    这里可以看到拷贝文件先进行了读,然后写入新的文件。

    总的来说shutil底层逻辑更严谨,考虑了快捷方式,文件权限,跨平台等问题。