为什么要用文件来操作数据?
在cmd下操作时,变量是放在内存中使用的,如果cmd一旦关闭变量就没有了下次就无法继续使用,所以就有了文件存在的意义。
数据的保存:
1 内存:常用的变量都是在内存里面的
2 文件:文本内容、二进制的文件内容
3 数据库:保存
操作文件的流程:
1 要读取的文件,路径一定要存在。
2 打开存在的文件:open函数
参数1:文件的路径,相对的,绝对的
参数2:打开文件的模式,r\w\a
编码:encoding="utf-8"
3 操作文件的内容,读、写(把原有内容清空在写)、追加
(原有内容不变,在它的最后面写上新的内容)
4 文件关闭掉。
D盘新建a.txt文件(新建文件的时候,默认保存是ansi编码(gbk),然后也可以选择utf-8。)
a.txt
什么1111
fef
光荣之路
#判断文件在不在
>>> import os.path #引入路径判断的包
#判断文件在不在用exists
>>> os.path.exists("d:\\a.txt") #绝对路径
True
>>> os.path.exists(r"d:\a.txt") #文件路径写\\,或者\前面加r
True
>>> os.path.exists("a.txt") #相对路径
False
>>>
>>> if os.path.exists("d:\\a.txt"):
... print("文件存在可以操作")
...
文件存在可以操作
>>>
绝对路径:从盘符开始完整的路径,, 例如:e:\test\test1\a.txt
相对路径:在当前的目录下,以它为根目录,使用相对路径进行查找,,例如:在e:\test\test1盘下执行py程序,程序里面使用了相对路径a.txt; 那么它对应的绝对路径: e:\test\test1\a.txt
>>> os.getcwd() #获取当前所在路径 'C:\\Users\\dell' >>>
#打开文件
>>> fp =open(r"d:\a.txt","r",encoding="utf-8") #打开文件,有三个常用的参数,fp是文件句柄
#open函数,如果没有写模式,
#默认是r模式,也就是读模式
#没有写编码,那么就是gbk
>>> fp #句柄:指向磁盘文件在内存或者磁盘上的位置指针
<_io.TextIOWrapper name='d:\\a.txt' mode='r' encoding='utf-8'>
>>> dir(fp)
['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'writelines']
>>> fp.read() #read读取全部文件内容
''
>>> fp.seek(0,0) #上一步已经读取了文件,文件的游标会指到文件的最末尾,如果想再次读取文件内容需要用seek将文件游标返回到文件最开始的位置
0
>>> fp.read()
'1111\nfef\n光荣之路'
>>> fp.close() #关闭文件
为什么一定要关闭文件?
- 文件不关闭,写入的内容太少,实际写的内容并不会立刻写到磁盘,其他文件操作可能会受限。
- 写入场景:一次写不多的内容,比如:100个字操作系统会把内容存在内存,不写入文件。
什么时候写入呢? 要等待写入的内容到一定量,64k才会写入。 fp.fluse() #立刻写入文件的方法 close之后,就会把所有待写入的内容保存到文件中
程序中不close会有什么影响:
1 python程序在执行完毕了,会自动close.
2 对于服务器端,不close,可能造成数据不真,正写入到文件里
3 对于服务器端,每次打开一个文件都不close
会把文件句柄(node)占用光.操作系统上打开文件是
有限制:65535个。达到65535个node被占用的时候
操作系统就死掉了,句柄耗尽。
结论:读写文件一定要close
问题:服务器端的程序是一直在执行?还是一会儿执行一会儿不执行?
服务器端的服务宗旨:尽管你可能不来,但是我们一定死等。
fp.read():读取文件的全部内容
>>> fp.readline() #readline每次读一行
'1111\n'
>>>
数据量大:readline()
优点:省内存
缺点:速度慢
数据量不大:read()把数据读到内存,
优点:操作起来很快,速度快
缺点:占内存
>>> fp.seek(0,0)
0
>>> fp.read(1) #只读一个字
'什'
>>> fp.tell() #tell告诉你文件游标所在位置,读取的是字节数
3
#我想指定读哪一行怎么办?
>>> fp.seek(0,0)
0
>>> fp.readlines() #readlines()读取每一行放列表里
['什么1111\n', 'fef\n', '光荣之路']
>>> fp.seek(0,0)
0
>>> lines =fp.readlines()
>>> lines[1] #然后在用坐标取
'fef\n'
>>> lines[0]
'什么1111\n'
>>>
不允许使用readlines,请计算一个文件的行数
#遍历读所有内文件的内容的方式:
>>> fp.seek(0,0)
0
>>> for line in fp:
... print(line,end="")
...
什么1111
fef
光荣之路>>>
>>> fp.seek(0,0)
0
>>> count =0
>>> for line in fp:
... count +=1
...
>>> count
3
while实现:
>>> count =0
>>> while fp.readline():
... count+=1
...
>>> print(count)
5
#写文件
#w模式不需要文件一定存在,如果文件不在会创建一个新的然后写,如果在且文件里有内容,会先清空原有内容后写入
>>> fp =open("d:\\a.txt","w",encoding="utf-8")
>>> fp.write(1111) #写入文件内容必须是字符串,否则报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: write() argument must be str, not int
>>> fp.write("123456")
6
>>> fp.flush() #用flush主动写入,或者close文件自动写入
>>>
#插入
#思路:先读取要插入位置的前面部分,在读取要插入位置的后面部分,然后把三部分拼接写入
#实现:
>>> fp = open("e:\\a.txt","r+",encoding="utf-8")
>>> two_word=fp.read(2)
>>> two_word
'光荣'
>>> last_two_word=fp.read(2)
>>> last_two_word
'之路'
>>> fp.seek(0,0)
0
>>> fp.write(two_word+"gr"+last_two_word)
6
>>> fp.close()
>>>
#写入的模式
r:read读
w:write写
a:append追加
w+:清空原有内容后,进行读写的模式
r+:保留原有内容后,进行读写的模式,写入内容的位置跟游标位置有关
a+:保留原有内容后,进行读写的模式,且写入内容永远在文件的最后一行
rb:读二进制
wb:写二进制
ab:追加二进制
#r+的细节示例:
>>> fp =open("d:\\a.txt","r+",encoding="utf-8")
>>> fp.read()
'123456\n78\n9\n101112'
>>> fp.write("光荣之路") #写入的时候未移动游标,游标在最末尾的位置,r+就会在最后继续写,前面原有内容不变
4
>>> fp.seek(0,0)
0
>>> fp.read()
'123456\n78\n9\n101112光荣之路'
>>> fp.close()
>>>
>>>
>>> fp = open("d:\\a.txt","r+",encoding="utf-8") >>> fp.seek(0,0) #写入前把游标移动到最开始的位置,在用r+写入时会从游标所在的位置覆盖写,其他内容不变 0 >>> fp.write("hahha") 5 >>> fp.read() '6\n78\n9\n101112光荣之路' >>>
小练习:将一张图片复制到另外文件名下
复制文件:rb读取所有的内容,写入另外一个文件
fp1=open("e:\\1.png","rb")
content = fp1.read()
fp1.close()
fp2=open("e:\\2.png","wb")
fp2.write(content)
fp2.close()
小练习:
造100个手机号,135-138之间不等,最后是001结束。
一个手机号11位。
import random
fp = open("e:\\a.txt","w",encoding="utf-8")
for i in range(100):
fp.write(str(random.randint(13500000,13899999))+"001\n")
fp.close()
with方式打开文件:会默认关闭文件
>>> with open("d:\\a.txt","r",encoding="utf-8") as fp:
... fp.read()
...
'hahha6\n78\n9\n101112光荣之路努力学习'
原理:先执行__enter__方法,执行后执行__exit__方法
class Sample:
def __enter__(self):
print("In __enter__()")
return "Foo"
def __exit__(self, type, value, trace):
print("In __exit__()")
def get_sample():
return Sample()
with get_sample() as sample:
print("sample:", sample)