一、pathlib
1、路径操作模块
2、3.4版本之前:
Os.path
3、基本操作:
from os import path
p = path.join('/etc','sysconfig','netwoek')
print(type(p),p) #输出。<class 'str'> /etc/sysconfig/netwoek
print(path.exists(p)) # 路径存在与否。False
print(path.split(p)) #输出('/etc/sysconfig', 'netwoek')
print(path.abspath('.')) #输出/home/python/wcl/projects/web
等价于path.abspath(‘ ’)
print(path.dirname(p)) #/etc/sysconfig
print(path.basename(p)) #netwoek
print(path.splitdrive(p)) #('', '/etc/sysconfig/netwoek')
##
from os import path
p1 = path.abspath(__file__)
print(p1,path.basename(p1))
while p1 != path.dirname(p1):
p1 = path.dirname(p1)
print(p1,path.basename(p1))
4、3.4版本开始
建议使用pathlib模块,提供path对象来操作,包括目录和文件。
5、pathlib模块
From pathlib import Path
6、目录操作
初始化:from pathlib import Path
p =Path() #输出格式。PosixPath('.')
p =Path('a','b','c/d') #输出格式PosixPath('a/b/c/d')
p =Path('/etc') #PosixPath('/etc')
7、路径拼接和分解
1)操作符/
Path 对象/Path对象
Path 对象/字符串或者 字符串/Path对象
2)分解
Parts属性,可以返回路径中的每一个部分
3)Joinpath
Joinpath(*other)
#代码块
p = Path()
p = p/'a' #PosixPath('a')
p1 = 'b'/p #PosixPath('b/a')
p2 = Path('c') #PosixPath('c')
p3 = p2 /p1 #PosixPath('c/b/a')
print(p3.parts) #('c', 'b', 'a')
p3.joinpath('etc','int.d',Path('.httpd'))
#PosixPath('c/b/a/etc/int.d/.httpd')
4)获取路径
Str获取路径字符串。
Bytes获取路径字符串的bytes
p = Path('/etc') #
print(str(p),bytes(p))
##/etc b'/etc'
5)父目录
Parent目录的逻辑就是父目录
Parents 父目录序列,索引0就是直接的父
取直接的父目录:p.parents[2] p.parent
取到根目录:
p = Path('/a/b/c/d')
print(p.parent.parent)
p.absolute().parents[len(p.absolute().parents)-1]
print(len(p.absolute().parents))
p = Path('/a/b/c/d')
print(p.parent.parent)
for x in p.parents:
print(x)
#/a/b
/a/b/c
/a/b
/a
/
6)name stem suffix suffixes with_suffix(suffix) with_name(name)
(1)name目录的最后一个部分
(2)Suffix目录中最后一个部分的拓展名
(3)Stem目录最后一个部分,没有后缀。
(4)Suffixes 返回多个扩展名列表。
(5)With_suffix(suffix)补充扩展名到路径尾部,返回新的路径,扩展名存在则无效。
(6)With_name(name)替换目录最后一个部分并返回一个新的路径。
p = Path('/etc/config/system/cf.config.gz')
print(p.name) #cf.config.gz
print(p.suffix) #.gz
print(p.suffixes) #['.config', '.gz']
print(p.stem) #cf.config
print(p.with_name('cf.config')) #/etc/config/system/cf.config
#代码:
p1 = Path('README')
print(p.with_suffix('.txt'))
#输出:/etc/config/system/cf.config.txt
(7)cwd()返回当前工作目录
(8)Home()返回当前家目录
(9)is_dir()是否是目录,目录存在返回True.
(10)is_symlink()是否是软连接
(11)is_file()是否是普通文件,文件存在返回True
(12)is_socket()是否是socket文件
(13)is_block)device()是否是块设备。
(14)is_char_device()是否是字符设备
(15)is_absolute()是否是绝对路径
(16)resolve()返回一个新的路径,这个新的路径就是当前Path的绝对路径,如果是软连接则直接被解析
(17)absolute()也可以获取绝对路径,但是推荐使用resolve()
(18)exists()目录或文件是否存在
(19)rmdir()删除空目录,没有提供判断目录为空的方法。
(20)touch(mode=0o666,exist_ok=True)创建一个文件
(21)as_uri()将文件路径返回URI。
(22)mkdir(mode=0o777,parents=False,exist_ok=False)
(23)Parents,是否创建父目录,True等同于mkdir-p:False时,父目录不存在,则抛出fileNotfounderror。
(24)exist_ok参数,在3.5版本加入,flase时路径存在,抛出异常,True时候异常被忽略。
(25)Iterdir()
迭代当前目录:
P = Path()
p = Path()
p /= 'a/b/c/d'
p.exists()
p = Path()
p /='a/b/c/d'
p.exists()
p.mkdir()
p.mkdir(parents=True)
p.exists()
p.mkdir(parents=True)
p.mkdir(parents=True,exist_ok=True)
p /='readme.txt'
p.parent.rmdir()
p.aprent.exists()
p.mkdir()
p.mkdir(marents=True)
for x in p.parents[len(p.parents)-1].iterdir():
print(x,end='\t')
if x.is_dir():
flag = False
for _ in x.iterdir():
flag = True
break
print('dir','Not Empty' if flag else 'Empyt',sep='\t')
elif x.is_file():
print('file')
else:
print('other file')
操作符/
7)通配符:glob(pattern)
通配给定的模式。
rglob(pattern)通配给定的模式,递归目录。
返回一个生成器;
list(p.glob('test')) #返回当前目录对象下的test开头的文件
list(p.glob('**/*.py'))#递归所有目录,等同于rglob
g = p.rglob('*.py') #生成器
next(g)
8)匹配:match(pattern)
**任意一级,通配符。
模式匹配,成功返回True。
Path('a/b.py').math('*.py') #True
Path('/a/b/c.py').math('b/*.py')#True
Path('/a/b/c.py').math('a/*.py') #False 因为a文件下找不到.Py文件
Path('/a/b/c.py').math('a/*/*.py')#True
Path('/a/b/c.py').math('a/**/*.py')#True
Path('/a/b/c.py').math('**/*.py')#True
9)Stat()相当于stat命令
lstat()同stat(),但如果是符号链接,则显示符号链接本身的文件信息
lstat()软连接命令,相当于软连接的。
##
from pathlib import Path
p = Path('test')
p.stat()
p1 = Path('t')
p1.stat()
p1.lstat()
10)文件操作
Open(mode=’r’,buffering=-1,encoding=None,errors=None,newline=None)
使用方法类似内建函数open,返回一个文件对象。
3.5增加的新函数
Read_bytes()
以’rb’读取路径相对文件,并返回二进制流。
Read_text(encoding=None,errors=None)
以’rt’ 方式读取路径对应文件,返回文本。
Path.write_bytes(data)
以’wb’方式写入数据到路径对应文件。
Write_text(data,encoding=None,errors=None)
以’wt’方式写入字符串到路径对应文件。
#p = Path('my_binary_file')
p.write_bytes(b'Binary file contents')
p.read_bytes()
#打印出b'Binary file contents'
#p = Path('my_text_file')
p.write_text('Text file contents')
p.read_text()
#打印出'Text file contents'
from pathlib import Path
p = Path('test.py')
p.write_text('hello python')
print(p.read_text())
with p.open()as f:
print(f.read(5))
##打印出hello python
hello
二、os模块
1、操作系统平台
属性方法 | 结果 |
Os.name | Windows是nt,,linux是posix |
Os.uname() | *nix支持 |
Sys.platform | Windows显示win32,linux显示linux |
Os.listdir(‘o:/tmp’)
Os也有open、read、write等方法,但是太低级,建议使用内建函数。
Ln -s test t1建立一个软连接
Os.stat(path,*,dir_fd=None,follow_symlinks=True)
本质上调用的是linux的stat。
Path:路径的string或者byetes,或者fd文件描述符。
follow_symlinks True 返回文本本身信息,False且如果是软连接则显示软连接的本身。
Os.chmod(path,mode,*,dir_fd=None,follow_syslinks=True)
Os.chmod(‘test’,0o777)
Os.chown(path,uid,gid)
改变文件的属组,属主,但是需要足够的权限。
2、shutil模块
到目前为止:文件拷贝:使用两个文件对象,源文件读取内容,写入目标文件中来完成拷贝过程。但是这样会丢失stat数据信息(权限等),复制的只是文件的内容,没办法复制权限等内容:
目录复制python提供了一个方便的库,shutil(高级文件操作)
3、Copy复制 权限和内容
1)Copyfileobj(fsrc,fdst[,length])
文件对象的复制,fsrc和fdst是open打开的文件对象,复制内容,fdst要求可写。Length指定表示了buffer的大小。
import shutil
src = 'test.txt'
dest = 'test1.txt'
with open(src) as f1:
with open(dest,'w+') as f2:
shutil.copyfileobj(f1,f2)
#不能完成copy,原因是指针移动了。
import shutil
with open('test.txt','w+')as f1:
f1.write('abc\n123')
f1.flush()
with open('test1.txt','w+')as f2:
shutil.copyfileobj(f1,f2)
#改正代码
import shutil
with open('test.txt','w+')as f1:
f1.write('abc\n123')
f1.flush()
f1.seek(0)
with open('test1.txt','w+')as f2:
shutil.copyfileobj(f1,f2)
总结:copyfile(src,dest,*,follow_symlinks=True)
复制文件内容,不含元数据,sc、dst为文件的路径字符串。
本质上就是调用copyfileobj,所以不带元数据二进制内容复制。
2) copymode(src,dst,*,follow_symlinks=True)
仅仅复制的是权限。
shutil.copymode('test.txt','test1.txt')
##显示权限等信息。
import shutil
import os
with open('test.txt','w+')as f1:
f1.write('abc\n123')
f1.flush()
f1.seek(0)
with open('test1.txt','w+')as f2:
shutil.copyfileobj(f1,f2)
print(os.stat('test.txt'))
print(os.stat('test1.txt'))
##打印出;
os.stat_result(st_mode=33206, st_ino=42502721483335735, st_dev=4009623578, st_nlink=1, st_uid=0, st_gid=0, st_size=8, st_atime=1524639016, st_mtime=1524639778, st_ctime=1524639016)
os.stat_result(st_mode=33206, st_ino=1407374883584914, st_dev=4009623578, st_nlink=1, st_uid=0, st_gid=0, st_size=8, st_atime=1524639016, st_mtime=1524639778, st_ctime=1524639016)
3)copystat(src,dst,*,follow_symlinks=True)
##shutil.copystat(f1,f2)复制元数据,stat包括权限。
4) 总结。复制文件内容,权限和部分元数据,不包括创建时间和修改时间。本质上是调用。
copyfile(src, dst, follow_symlinks=follow_symlinks)
copymode(src, dst, follow_symlinks=follow_symlinks)
4、Copy2 stat 和内容
比copy多了复制全部元数据,需要平台的支持。
本质上调用了。
copyfile(src, dst, follow_symlinks=follow_symlinks)
copystat(src, dst, follow_symlinks=follow_symlinks)
5、Copytree 递归复制目录
Copytree(src,dst,symlinks=Flase,ignore=None,copy_function=copy2,ignore_dangling_symlinks=False).递归复制的目录,默认使用copy2,也就是带更多的元数据复制。
Src 、dst必须是目录,src必须存在,dst必须不存在,提供一个callable(src,names)-》ignore_names.提供一个函数,他就会被调用。Src是源目录,names是os.listdir(src)的结果,就是列出src中的文件名称,返回值是要被过滤的文件名的set类型。
Src dst 必须为目录。
6、rm删除
Shutil.rmtree(path,ignore_errors=False,onerrors=None)
递归删除,如同rm-fd一样危险,慎用。
不是原子操作,有可能删除操作,就会中断,已经删除的就是已经删除了。
Ignore_error为True,忽略错误,当为False或者omitted时候oneerrors生效。
Oneerror刷为callable,接受函数function、path和execinfo。
Shutil.rmtree(‘test’)
7、move移动
Move(src,dst,copy_function=copy2)
递归移动文件、目录到目标,返回目标。本身使用的是os.rename方法。
如果不支持rename,如果是目录则想copytree在删除源目录。
默认使用copy2方法
Shutil还有打包功能,生成tar并压缩,支持,zip、gz、bz、xz。