7.1 文件存储
1、open()函数与文件打开模式
Python中读写文件非常简单,通过 open()函数
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
一般了解前两个参数就够了,file参数代表文件名,如果不带上路径的话,会在当前文件夹里查找, 而mode参数代表文件的打开模式,有如下表所示的几种打开模式:
模式 | 作用 |
r | 只读模式打开,默认 |
w | 写模式打开,若文件存在,先删除,然后重新创建 |
a | 追加模式打开,追加到文件末尾,seek()指向其他地方也没用,文件不存在,自动创建 |
b | 二进制模式打开 |
t | 文本模式打开,默认 |
+ | 可读写模式,可配合其他模式使用,比如r+,w+ |
x | 如果文件已存在,用此模式打开会引发异常 |
U | 通用换行符支持 |
另外,实用open函数打开文件时要做下:异常捕获,比如下面这样的代码:
f = open('test.txt', 'r')
如果test.txt文件不存在的话,会抛出一个 FileNotFoundError错误
,所以需要进行异常捕获。另外,文件使用完毕后必须关闭,文件对象会占用操作系统的资源,操作系统同一时间能打开的文件数量也是有限的。所以为了保证正常或发生异常的时候文件都能关闭,需要把关闭操作写到finally块里,示例代码如下:
try:
f = open('test.txt', 'r')
print(f.read())
finally:
if f:
f.close()
但是每次都要这样写的话显得有些繁琐了,可以使用Python提供的 with语句
with open('test/txt', 'r') as f:
print(f.read())
相比每次都要写try-finally异常捕获,这种方式简洁得多,而且不用怕忘记关闭文件。
2、file对象提供的函数
file对象提供了如下表所示的可供调用的方法:
函数 | 作用 |
close() | 关闭文件,关闭后文件不能再进行读写操作 |
read(size=-1) | 从文件读取指定的字节数,如果未设置或为负数,读取所有 |
next() | 返回文件下一行 |
readline() | 读取整行,包括换行符’\n’ |
seek(offset, from) | 设置当前文件指针的位置,从from(0文件起始位置,1当前位置, 2文件末尾)偏移offset个字节 |
tell() | 返回文件的当前位置 |
write(str) | 将字符串写入文件 |
writelines(seq) | 写入一个序列字符串列表,如果要换行,需要自己加入每行的换行符 |
truncate([size]) | 截断文件并返回截断的字节长度,指定长度就从开头开始截断指定长度, 其余内容删除;不指定的话,从开头截取到当前位置,其余内容删除。 |
3、常见的文件操作示例
文件的常用操作有创建,写入,读取,还有追加,代码示例如下:
# 1.创建一个可读写的文件
def mk_file(file):
with open(file, 'w+', encoding='UTF-8') as f:
print("创建了一个可读写的文件:%s" % file)
# 2.往文件中写入内容
def write_to_file(file, content):
with open(file, 'w+', encoding='UTF-8') as f:
f.write(content + '\n')
print("内容写入成功!")
# 3.读取文件里的内容
def read_from_file(file):
with open(file, 'r+', encoding='UTF-8') as f:
print("输出文件内容:" + f.read())
# 4.往文件追加内容
def append_to_file(file, content):
with open(file, 'a+', encoding='UTF-8') as f:
f.write(content + '\n')
print("内容追加成功!")
if __name__ == '__main__':
file_name = 'test.txt'
mk_file(file_name)
write_to_file(file_name, "人生苦短我用Python!")
read_from_file(file_name)
append_to_file(file_name, "Hello Python!")
read_from_file(file_name)
运行结果如下:
创建了一个可读写的文件:test.txt
内容写入成功!
输出文件内容:人生苦短我用Python!
内容追加成功!
输出文件内容:人生苦短我用Python!
Hello Python!
4、os模块里的常用函数
Python中为我们提供了一个
os模块
用于处理文件和目录
,除此之外它的子模块path模块
还提供了文件路径相关
① os模块常用函数
os模块常用的函数如下表所示:
函数 | 作用 |
close() | 关闭文件,关闭后文件不能再进行读写操作 |
getcwd() | 返回当前工作目录 |
chdir(path) | 改变当前工作目录 |
listdir(path=’.’) | 不写参数默认列举当前目录下所有文件和文件夹,’.‘当前目录, ’…'上一层目录 |
mkdir(path) | 创建文件夹,若存在会抛出FileExistsError异常 |
mkdirs(path) | 可用于创建多层目录 |
remove(path) | 删除指定文件 |
rmdir(path) | 删除目录 |
removedirs(path) | 删除多层目录 |
rename(old,new) | 重命名文件或文件夹 |
system(command) | 调用系统提供的小工具,比如计算器 |
walk(top) | 遍历top参数指定路径下所有子目录,返回一个三元组(路径, [包含目录],[包含文件]) |
curdir | 当前目录(.) |
pardir | 上一节目录(…) |
sep | 路径分隔符,Win下是’’,Linux下是’/’ |
linesep | 当前平台使用的行终止符,win下是’\r\n’,Linux下是’\n’ |
pathsep | 输出用于分割文件路径的字符串 |
name | 当前使用的操作系统 |
stat(path) | 获取文件目录信息 |
environ | 获取系统环境变量 |
system(“bash command”) | 执行shell命令,直接显示 |
② os.path模块常用函数
os.path模块常用的函数如下表所示:
函数 | 作用 |
dirname(path) | 获得路径名 |
basename(path) | 获得文件名 |
join(path1[,path2[,…]]) | 将路径名与文件名拼接成一个完整路径 |
split(path) | 分割路径与文件名,返回元组(f_path, f_name),如果完全使用目录,它也会将最后一个目录作为文件名分离,且不会判断文件或目录 是否存在 |
splitext(path) | 分隔文件名与扩展名 |
getsize(file) | 获得文件大小,单位是字节 |
getatime(file) | 获得文件最近访问时间,返回的是浮点型秒数 |
getctime(file) | 获得文件的创建时间,返回的是浮点型秒数 |
getmtime(file) | 获得文件的修改时间,返回的是浮点型秒数 |
exists(path) | 判断路径(文件或目录)是否存在 |
isabs(path) | 判断是否为决定路径 |
isdir(path) | 判断是否存在且是一个目录 |
isfile(path) | 判断是否存在且是一个文件 |
islink(path) | 判断是否存在且是一个符号链接 |
ismount(path) | 判断是否存在且是一个挂载点 |
samefile(path1,path2) | 判断两个路径是否指向同一个文件 |
5、实用代码示例
① 批量替换多个文件中的内容
比如说现在有这样一批文件,文件内容都是:
1.Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++
里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。
Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员
以优雅的思维方式进行复杂的编程。
现在需要把文件里的Java都替换成Python,我们可以通过编写脚本来完成这项繁琐的工作,具体代码如下:
import os
def replace(dir_path, word_before, word_after):
file_list = []
# 遍历获得文件地址
for f in os.listdir(dir_path):
file_list.append(os.path.join(dir_path, f))
# 打开文件,按行读取,替换对应内容
for file in file_list:
with open(file, 'r+', encoding='UTF-8') as f:
content = f.read()
f.seek(0)
f.truncate()
f.write(content.replace(word_before, word_after))
if __name__ == '__main__':
replace(os.path.join(os.getcwd(), 'doc'), 'Java', 'Python')
运行结果如下:
1.Python是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Python语言具有功能强大和简单易用两个特征。Python语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。
② 批量文件重命名
有时我们需要对一堆文件进行批量命名,比如需要把下面这样的图片名字统一改成image_1这样的形式。在学习本节之前,你可能需要复制下image_,然后一个个图片重命名,学习完本节后我们可以动手写一个批量文件重命名的脚本。
程序还是比较简单的,分两步:
- 1.获取某个文件夹里所有的文件完整路径名
- 2.调用file对象的rename函数仅限替换
具体代码如下:
import os
def rename(file_dir, model_name, file_type):
pos = 1
# 获取文件夹下所有文件(包括文件夹)
file_list = os.listdir(file_dir)
for file in file_list:
# 判断是否为对应后缀的文件
if file.endswith(file_type):
try:
# 旧文件名
old_name = os.path.join(file_dir, file)
# 新文件名
new_name = os.path.join(file_dir, model_name + str(pos) + file_type)
os.rename(old_name, new_name)
pos = pos + 1
except:
continue
rename(os.path.join(os.getcwd(), 'res'), 'image_', '.png')
运行结果如下: