读取文件的三个方法:read()、readline()、readlines()。均可接受一个方法参数用以限制每次读取的数据量,但通常不使用。
read()
优点:读取整个文件,将文件内容放到一个字符串变量中。
劣势:如果文件非常大,尤其是大于内存时,无法使用read()方法。
总结:不适用于读取大文件
readline()
优点:readline()方法每次读取一行;返回的是一个字符串对象,保存当前行的内存,不占用内存
缺点:比readlines慢得多
包含知识点
- 当你每次调用readline()方法时,你的文件指针就会指向当前行尾部,一个换行符 \n 占两位,一个中文也是
- 读取到最后一行之后再调用readline()就会返回空,结束循环
readlines()
特点:一次性读取整个文件;自动将文件内容分析成一个行的列表
包含知识点
- readlines()读取所有行然后把它们作为一个字符串列表返回
- 返回的每一行内容包含换行符
文件关闭:
由于文件读写时都有可能产生 IOError ,一旦出错,后面的 f.close() 就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用 try ... finally 来实现:
try:
f = open('/path/to/file', 'r')
print(f.read())
finally:
if f:
f.close()
每次这样写太繁琐了,所以Python引入了 with open() 来自动调用close()方法,无论是否出错
open() 与 with open() 区别
1、open需要主动调用close(),with不需要
2、open读取文件时发生异常,没有任何处理,with有很好的处理上下文产生的异常
with open()同时操作多个文件
with open("test/test.py", 'r') as f1, open("test/test2.py", 'r') as f2:
print(f1.read())
print(f2.read())
写文件
写文件和读文件是一样的,唯一区别是调用 open() 函数时,需要将 mode 参数改成可写的模式,如上面的表格所示
f = open("test/test.py", "a+")
f.write("test")
f.writelines("polo")
print(f.read())
f.close()
写文件的原理
当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。
只有调用 close() 方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()
的后果是数据可能只写了一部分到磁盘,剩下的丢失了。
所以,还是用with语句好鸭!
关于字符编码
要写入特定编码的文本文件,请给 open() 函数传入 encoding 参数,将字符串自动转换成指定编码,默认 encoding=None
例如,读取utf-8编码的文件:
f = open('test/utf8.txt', 'r', encoding='utf-8')
print(f.read())
遇到有些编码不规范的文件,你可能会遇到 UnicodeDecodeError ,因为在文本文件中可能夹杂了一些非法编码的字符。
遇到这种情况, open() 函数还接收一个 errors 参数,默认是 errors=None 表示如果遇到编码错误后如何处理。最简单的方式是直接忽略。
f = open('test/utf8.txt', 'r', encoding='utf-8', errors='ignore')
os.open()
格式
os.open(file, flags[, mode])
参数
- file:要打开的文件
- flags:该参数可以是以下选项,多个使用 "|" 隔开,只列常用的:
- os.O_RDONLY: 以只读的方式打开
- os.O_WRONLY: 以只写的方式打开
- os.O_RDWR : 以读写的方式打开
- os.O_APPEND: 以追加的方式打开
- os.O_CREAT: 创建并打开一个新文件
- 划重点!!!不建议使用os.open,还是用with open()