一、文件操作的流程:

  1. 打开文件,得到文件句柄并赋值给一个变量
  2. 通过句柄对文件进行操作
  3. 关闭文件
    具体步骤如下:
f=open('test.txt',encoding='utf-8')   #打开文件
data=f.read()            #文件操作
print(data)
f.close()          #关闭文件

二、open()函数的具体用法:

open函数最常用的使用方法如下:文件句柄 = open(‘文件路径’, ‘模式’,编码方式)。

1、关于文件路径

#文件路径:主要有两种,一种是使用相对路径,想上面的例子就是使用相对路径。
#另外一种就是绝对路径,像' C:/Users/shu/Desktop/python/test.txt'

2、关于打开模式:

# r    以只读方式打开文件。这是默认模式。文件必须存在,不存在抛出错误
#rb    以二进制格式打开一个文件用于只读。
#r+    打开一个文件用于读写。文件指针将会放在文件的开头。读完就追加。
#w    打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
#w+    打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
#a    打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
#a+    打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。注:后面有带b的方式,不需要考虑编码方式。有带+号的,则可读可写,不过它们之间还是有区别的

下面附上各种方法的代码,便于更深刻理解各种模式:

原来文件内容是:
自恐多情损梵行,入山又怕误倾城.世间安得双全法,不负如来不负卿.

1.只读模式r:

f=open('test.txt','r')
data=f.read()
print(data)           #自恐多情损梵行,入山又怕误倾城.世间安得双全法,不负如来不负卿.
f.close() 

2.只写模式,w (存在会覆盖原来内容)

'''
'''
f=open('test.txt','w')
f.write('作者:仓央嘉措')
f.close()              #写完后原来的内容全都不见了,只剩下'作者:仓央嘉措'.

3、追加模式,a

f=open('test.txt','a')
f.write('作者:仓央嘉措')
f.close()              #写完内容如下:自恐多情损梵行,入山又怕误倾城.世间安得双全法,不负如来不负卿.作者:仓央嘉措

4、以r+模式打开

f=open('test.txt','r+')
f.write('作者:仓央嘉措')
print(f.read())         # 输出为" ,入山又怕误倾城.世间安得双全法,不负如来不负卿."         
f.close()            
#写完内容为 “ 作者:仓央嘉措,入山又怕误倾城.世间安得双全法,不负如来不负卿.”
#为什么输出和写完内容会这样呢? 解释这个只要知道紧跟光标的位置就可以明白了。

首先,以r方式打开光标都会在最开始的位置,这时候执行f.write(‘作者:仓央嘉措’) ,这时候就把原来的‘自恐多情损梵行’覆盖了。
这时候光标移动到’,'之前,紧接着进行print(f.read())。就会把后面剩下的文本内容打印出来。所以输出就是:" ,入山又怕误倾城.世间安得双全法,不负如来不负卿." 整个程序完成后,整个文本内容就成了;“ 作者:仓央嘉措,入山又怕误倾城.世间安得双全法,不负如来不负卿.”(光标!!)

3、关于编码方式:

  • win系统默认是gbk编码的,所以桌面生成的TXT之类的都是gbk编码的。
  • 出现乱码正常都是原文件的编码方式和打开指定的编码不一致所致

三、关闭文件:

不要小看这一步,因为我们读取文件是把文科读取到内存中的,如果我们没关闭它,它就会一直占用系统资源,而且还可能导致其他不安全隐患。还有一种方法可以让我们不用去特意关注关闭文件。那就是 with open()

with open('test.txt','a+') as f:
    f.write('作者:仓央嘉措')
    print(f.read())