为什么要用文件来操作数据?

在cmd下操作时,变量是放在内存中使用的,如果cmd一旦关闭变量就没有了下次就无法继续使用,所以就有了文件存在的意义。

数据的保存:

1 内存:常用的变量都是在内存里面的

2 文件:文本内容、二进制的文件内容

3 数据库:保存

 

 

操作文件的流程:

1 要读取的文件,路径一定要存在。

2 打开存在的文件:open函数 

  参数1:文件的路径,相对的,绝对的

  参数2:打开文件的模式,r\w\a

  编码:encoding="utf-8"

3 操作文件的内容,读、写(把原有内容清空在写)、追加

(原有内容不变,在它的最后面写上新的内容)

4 文件关闭掉。

 

 

D盘新建a.txt文件(新建文件的时候,默认保存是ansi编码(gbk),然后也可以选择utf-8。)

a.txt

什么1111
fef
光荣之路

 

#判断文件在不在

>>> import os.path  #引入路径判断的包
#判断文件在不在用exists
>>> os.path.exists("d:\\a.txt")   #绝对路径
True
>>> os.path.exists(r"d:\a.txt")  #文件路径写\\,或者\前面加r
True
>>> os.path.exists("a.txt")   #相对路径
False
>>>
>>> if os.path.exists("d:\\a.txt"):
...     print("文件存在可以操作")
...
文件存在可以操作
>>>
绝对路径:从盘符开始完整的路径,, 例如:e:\test\test1\a.txt
相对路径:在当前的目录下,以它为根目录,使用相对路径进行查找,,例如:在e:\test\test1盘下执行py程序,程序里面使用了相对路径a.txt; 那么它对应的绝对路径: e:\test\test1\a.txt

>>> os.getcwd() #获取当前所在路径 'C:\\Users\\dell' >>>

 

 

#打开文件

>>> fp =open(r"d:\a.txt","r",encoding="utf-8")   #打开文件,有三个常用的参数,fp是文件句柄
#open函数,如果没有写模式,
#默认是r模式,也就是读模式
#没有写编码,那么就是gbk
>>> fp   #句柄:指向磁盘文件在内存或者磁盘上的位置指针
<_io.TextIOWrapper name='d:\\a.txt' mode='r' encoding='utf-8'>
>>> dir(fp)
['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'writelines']
>>> fp.read()  #read读取全部文件内容
''
>>> fp.seek(0,0)  #上一步已经读取了文件,文件的游标会指到文件的最末尾,如果想再次读取文件内容需要用seek将文件游标返回到文件最开始的位置
0 
>>> fp.read()
'1111\nfef\n光荣之路'
>>> fp.close()  #关闭文件

为什么一定要关闭文件?

  • 文件不关闭,写入的内容太少,实际写的内容并不会立刻写到磁盘,其他文件操作可能会受限。
  • 写入场景:一次写不多的内容,比如:100个字操作系统会把内容存在内存,不写入文件。

                      什么时候写入呢?                     要等待写入的内容到一定量,64k才会写入。                     fp.fluse() #立刻写入文件的方法                     close之后,就会把所有待写入的内容保存到文件中

程序中不close会有什么影响:

1 python程序在执行完毕了,会自动close.

2 对于服务器端,不close,可能造成数据不真,正写入到文件里

3 对于服务器端,每次打开一个文件都不close

会把文件句柄(node)占用光.操作系统上打开文件是

有限制:65535个。达到65535个node被占用的时候

操作系统就死掉了,句柄耗尽。

 

结论:读写文件一定要close

问题:服务器端的程序是一直在执行?还是一会儿执行一会儿不执行?

服务器端的服务宗旨:尽管你可能不来,但是我们一定死等。

 

fp.read():读取文件的全部内容
>>> fp.readline()   #readline每次读一行
'1111\n'
>>>
数据量大:readline()
优点:省内存
缺点:速度慢
数据量不大:read()把数据读到内存,
优点:操作起来很快,速度快
缺点:占内存

>>> fp.seek(0,0)
0
>>> fp.read(1)   #只读一个字
'什'
>>> fp.tell()   #tell告诉你文件游标所在位置,读取的是字节数
3 


#我想指定读哪一行怎么办?
>>> fp.seek(0,0)
0
>>> fp.readlines()   #readlines()读取每一行放列表里
['什么1111\n', 'fef\n', '光荣之路']
>>> fp.seek(0,0)
0
>>> lines =fp.readlines()
>>> lines[1]  #然后在用坐标取
'fef\n'
>>> lines[0]
'什么1111\n'
>>>


不允许使用readlines,请计算一个文件的行数
#遍历读所有内文件的内容的方式:
>>> fp.seek(0,0)
0
>>> for line in fp:
...     print(line,end="")
...
什么1111
fef
光荣之路>>>
>>> fp.seek(0,0)
0
>>> count =0
>>> for line in fp:
...     count +=1
...
>>> count
3
while实现:
>>> count =0
>>> while fp.readline():
...     count+=1
...
>>> print(count)
5

 

#写文件

#w模式不需要文件一定存在,如果文件不在会创建一个新的然后写,如果在且文件里有内容,会先清空原有内容后写入

>>> fp =open("d:\\a.txt","w",encoding="utf-8")
>>> fp.write(1111)   #写入文件内容必须是字符串,否则报错
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: write() argument must be str, not int
>>> fp.write("123456")
6
>>> fp.flush()  #用flush主动写入,或者close文件自动写入
>>>

#插入
#思路:先读取要插入位置的前面部分,在读取要插入位置的后面部分,然后把三部分拼接写入
#实现:
>>> fp = open("e:\\a.txt","r+",encoding="utf-8")
>>> two_word=fp.read(2)
>>> two_word
'光荣'
>>> last_two_word=fp.read(2)
>>> last_two_word
'之路'
>>> fp.seek(0,0)
0
>>> fp.write(two_word+"gr"+last_two_word)
6
>>> fp.close()
>>>


#写入的模式
r:read读
w:write写
a:append追加

w+:清空原有内容后,进行读写的模式
r+:保留原有内容后,进行读写的模式,写入内容的位置跟游标位置有关
a+:保留原有内容后,进行读写的模式,且写入内容永远在文件的最后一行

rb:读二进制

wb:写二进制

ab:追加二进制

 

 

#r+的细节示例: 
      
 
      
>>> fp =open("d:\\a.txt","r+",encoding="utf-8")
>>> fp.read()
'123456\n78\n9\n101112'
>>> fp.write("光荣之路")  #写入的时候未移动游标,游标在最末尾的位置,r+就会在最后继续写,前面原有内容不变
4
>>> fp.seek(0,0)
0
>>> fp.read()
'123456\n78\n9\n101112光荣之路'
>>> fp.close()
>>>
>>>
 
>>> fp = open("d:\\a.txt","r+",encoding="utf-8") >>> fp.seek(0,0) #写入前把游标移动到最开始的位置,在用r+写入时会从游标所在的位置覆盖写,其他内容不变 0 >>> fp.write("hahha") 5 >>> fp.read() '6\n78\n9\n101112光荣之路' >>>

小练习:将一张图片复制到另外文件名下

复制文件:rb读取所有的内容,写入另外一个文件


fp1=open("e:\\1.png","rb")

content = fp1.read()

fp1.close()

  
fp2=open("e:\\2.png","wb")

fp2.write(content)

fp2.close()

小练习:

造100个手机号,135-138之间不等,最后是001结束。

一个手机号11位。

import random

fp = open("e:\\a.txt","w",encoding="utf-8")

for i in range(100):

    fp.write(str(random.randint(13500000,13899999))+"001\n")    
fp.close()

 

 

with方式打开文件:会默认关闭文件

>>> with open("d:\\a.txt","r",encoding="utf-8") as fp:
...     fp.read()
...
'hahha6\n78\n9\n101112光荣之路努力学习'

原理:先执行__enter__方法,执行后执行__exit__方法

class Sample:
    def __enter__(self):
        print("In __enter__()")
        return "Foo"

    def __exit__(self, type, value, trace):
        print("In __exit__()")

def get_sample():
    return Sample()

with get_sample() as sample:
    print("sample:", sample)