文件的操作主要分为读取和写入两种,读取文件是指将磁盘上的文件内容读入内存或命名管道,写入文件则是将内存、缓冲区或命名管道内的内容写入磁盘上指定文件。Python 中操作文件也有两种常用方法,一是使用内置支持的 file 对象完成大部分文件操作,二是使用 os 模块提供的更为丰富的函数完成对文件和目录的操作。
在读取或写入文件之前,必须使用内置函数 open( ) 打开它,其语法是:
file object = open(filename [, accessmode="r"] [, buffering="-1"] [, encoding=None] [, errors=None] [, newline=None] [, closefd=True] [, opener=None])
其中 filename 是要访问的文件的文件名字符串,accessmode 用于指定文件打开的模式,详细的模式见表 1。
表 1:open( ) 函数的 accessmode 参数
模式
描述
r
以只读方式打开文件,指针指向文件头
rb
以只读方式打开二进制文件,指针指向文件头
r+
以读写方式打开文件,指针指向文件头
rb+
以读写方式打开二进制文件,指针指向文件头
w
以只写方式打开文件,若文件已存在则覆盖该文件,若文件不存在则创建新文件
wb
以只写方式打开二进制文件,若文件已存在则覆盖该文件,若文件不存在则创建新文件
w+
以读写方式打开文件,若文件已存在则覆盖该文件,若文件不存在则创建新文件
wb+
以读写方式打开二进制文件,若文件已存在则覆盖该文件,若文件不存在则创建新文件
a
以追加方式打开文件,指针指向文件尾,若文件不存在则创建新文件
ab
以追加方式打开二进制文件,指针指向文件尾,若文件不存在则创建新文件
a+
以追加、读写方式打开文件,指针指向文件尾,若文件不存在则创建新文件
ab+
以追加、读写方式打开二进制文件,指针指向文件尾,若文件不存在则创建新文件
通常,文件以文本模式被打开,这意味着从文件读出和向文件写入的字符串会被特定的编码方式(默认是 UTF-8)编码。而以二进制模式打开文件表示数据会以字节对象的形式读出和写入,这种模式应该用于存储非文本内容的文件。
在文本模式下,读取时默认会将平台有关的行结束符(UNIX 上是 \n,Windows 上是 \r\n)转换为 \n,在文本模式下写入时默认会将出现的 \n 转换成平台有关的行结束符,这种做法可能会损坏二进制文件,因此对不同类型的文件要采用正确的模式读写。
buffering 用于指明访问文件时的缓冲区设置,取值为 0 表示不使用缓冲,取值为 1 表示在访问文件进行时使用行缓冲(仅用于文本模式),取值为大于 1 的整数表示使用固定大小的缓冲区进行缓冲,取值为负数表示使用系统默认大小的缓冲区。
encoding 用于编码或解码文件的编码名称。该参数应仅用于文本模式,默认的编码是平台依赖的。
errors 用于指定如何操作编、解码的错误,此参数不能用于二进制模式。常见的可取值如表 2 所示。
表 2:open() 函数的 errors 参数
可取值
描述
strict 或 None
如果有编码错误,引发 ValueError 异常
ignore
忽略错误
replace
在出现畸形数据的地方插入替代符号
surrogateescape
将任何不正确的字节以 Unicode Private Use Area 中的代码点表示
xmlcharrefreplace
编码不支持的字符会用适当的 XML 字符替换,只支持写入文件
backslashreplace
使用反斜杠转义序列替换畸形数据
namereplace
使用\n{…}转义序列替换不支持的字符,只支持写入文件
newline 用于控制通用换行模式如何运行(只支持文本模式),取值可以是 None、(空串)、\n、\r 和 \r\n。当读取输入时,如果取值为 None,启用通用换行模式,输入中的行尾可以是 \n、\r或\r\n,在返回给调用者前会被转换为\n;如果参数值是(空串)也将启用通用换行模式,但是返回给调用者时行尾不做转换;
如果取值为其他任意合法值,输入行以给定字符串结束,返回给调用者时行尾也不做转换。当输出写入时,如果取值为None,任意写入的\n将被转换为系统默认的行分隔符;如果取值为(空串)或 \n,不进行转换;如果取值为其他任意合法值,所有写入的 \n 字符将转换为给定字符串。
closefd 指明关闭文件时文件描述符的状态。若 closefd 为 False,且给定文件描述符(注意不是文件名),则当文件关闭时文件描述符将保持打开。若给定文件名,则 closefd 必须为 True(默认),否则将引发错误。
opener 用于传递调用一个自定义打开器,通过调用 opener 获取文件对象的文件描述符。
以下代码使用内置支持的 file 对象展示了常见的文件操作:
#打开文件
f = open("test.txt", "w+")
#获取文件描述符
print(f.fileno())
#写入文本
f.write("Python 语言很强大。\n是的,的确非常强大!\n")
#关闭文件
f.close()
#以只读方式打开文件
f = open("test.txt", "r")
#读取文件内容并输出至终端屏幕
print(f.read())
#关闭打开的文件
f.close()
上述代码的运行结果如下所示:
>>> f = open("test.txt", "w+")
>>> print(f.fileno())
3
>>> f.write("Python 语言很强大。\n是的,的确非常强大!\n")
25
>>> f.close()
>>> f = open("test.txt", "r")
>>> print(f.read())
Python 语言很强大。
是的,的确非常强大!
>>> f.close()
生成的 test.txt 文件的内容如下所示:
Python 语言很强大。
是的,的确非常强大!