二十八 二十九  文件

打开文件 open(文件名[,模式][,缓冲])  注意open是个函数不是方法

模式:

小甲鱼python学习网站_操作系统

缓冲:

大于1的数字代表缓冲区的大小(单位是字节),-1(或者是任何负数)代表使用默认缓冲区大小

只有用flush或者close时才会更新硬盘的数据

 

三种标准的流:

输入:sys.stdin 输出:sys.stdout  错误:sys.stderr

小甲鱼python学习网站_爬虫_02

小甲鱼python学习网站_小甲鱼python学习网站_03

用list()让文件成为一个列表,每一行是一个元素

小甲鱼python学习网站_小甲鱼python学习网站_04

用f.seek(0,0)还原文件指针到起始位置

用for读取文件中的每一行

小甲鱼python学习网站_小甲鱼python学习网站_05

 

三十  os模块和os.path模块

Python os模块包含普遍的操作系统功能,注意括号中需要使用字符串

1.getcwd()

返回当前工作目录

2.chdir(path)

改变工作目录

3.listdir(path='.')

列举指定目录中的文件名('.'表示当前目录,'..'表示上一级目录)

4.mkdir(path)

创建单层目录,如该目录已存在抛出异常

5.makedirs(path)

递归创建多层目录,如该目录已存在抛出异常,注意:'E:\\a\\b'和'E:\\a\\c'并不会冲突

6.remove(path)

删除文件

7.rmdir(path)

删除单层目录,如该目录非空则抛出异常

8.removedirs(path)

递归删除目录,从子目录到父目录逐层尝试删除,遇到目录非空则抛出异常

9.rename(old, new)

将文件old重命名为new

10.system(command)

运行系统的shell命令

 

以下函数没有参数

11.os.curdir

指代当前目录('.')

12.os.pardir

指代上一级目录('..')

13.os.sep

输出操作系统特定的路径分隔符(Win下为'\\',Linux下为'/')

14.os.linesep

当前平台使用的行终止符(Win下为'\r\n',Linux下为'\n')

15.os.name

指代当前使用的操作系统(包括:'posix', 'nt', 'mac', 'os2', 'ce', 'java')

 

os.path模块

1.basename(path)

去掉目录路径,单独返回文件名

2.dirname(path)

去掉文件名,单独返回目录路径

3.join(path1[, path2[, ...]])

将path1, path2各部分组合成一个路径名

4,split(path)

分割文件名与路径,返回(f_path, f_name)元组。如果完全使用目录,它也会将最后一个目录作为文件名分离,且不会判断文件或者目录是否存在

5.splitext(path)

分离文件名与扩展名,返回(f_name, f_extension)元组

6.getsize(file)

返回指定文件的尺寸,单位是字节

7.getatime(file)

返回指定文件最近的访问时间(浮点型秒数,可用time模块的gmtime()或localtime()函数换算)

8.getctime(file)

返回指定文件的创建时间(浮点型秒数,可用time模块的gmtime()或localtime()函数换算)

9.getmtime(file)

返回指定文件最新的修改时间(浮点型秒数,可用time模块的gmtime()或localtime()函数换算)

 

以下为函数返回 True 或 False

10.exists(path)

判断指定路径(目录或文件)是否存在

11.isabs(path)

判断指定路径是否为绝对路径

12.isdir(path)

判断指定路径是否存在且是一个目录

13.isfile(path)

判断指定路径是否存在且是一个文件

14.islink(path)

判断指定路径是否存在且是一个符号链接

15.ismount(path)

判断指定路径是否存在且是一个挂载点

16.samefile(path1, paht2)

判断path1和path2两个路径是否指向同一个文件

 

三十一  pickle模块

以二进制保存数据

三步走:打开文件,用pickle.dump()方法将数据放入文件,关闭文件



1 import pickle
2 my_list = [1,2,'老王',['abc']]
3 pickle_file = open('my_list.pkl','wb') #文件名后缀无所谓
4 pickle.dump(my_list,pickle_file)
5 pickle_file.close()



 

这样文件夹中就保存了my_list.pkl文件,(查询当前目录是用 import os   os.getcwd())

读取数据

打开文件,调用pickle.load()方法



pickle_file = open('my_list.pkl','rb')
list2 = pickle.load(pickle_file)
print(list2)



 

三十二 三十三  异常

常见异常类型:

AttributeError:属性错误,特性引用和赋值失败时会引发属性错误
NameError:试图访问的变量名不存在
SyntaxError:语法错误,代码形式错误
Exception:所有异常的基类,因为所有python异常类都是基类Exception的其中一员,异常都是从基类Exception继承的,并且都在exceptions模块中定义。
IOError:一般常见于打开不存在文件时会引发IOError错误,也可以解理为输出输入错误
KeyError:使用了映射中不存在的关键字(键)时引发的关键字错误
IndexError:索引错误,使用的索引不存在,常索引超出序列范围,什么是索引
TypeError:类型错误,内建操作或是函数应于在了错误类型的对象时会引发类型错误
ZeroDivisonError:除数为0,在用除法操作时,第二个参数为0时引发了该错误
ValueError:值错误,传给对象的参数类型不正确,像是给int()函数传入了字符串数据类型的参数。

 

捕获异常

try语句一旦被检测出异常,剩下的语句将不会被执行

几种搭配:

1.try except



1 try:
2     sum = 1/0
3 except ZeroDivisionError:
4     print('出错')



 

可以指明出错原因:



1 try:
2     sum = 1/0
3 except ZeroDivisionError as reason:
4     print('出错,错误原因:',str(reason))



 

可以用多个except语句:



1 try:
2     f = open("nofile.txt")
3     sum = 1/0
4 except IOError as reason:
5     print('出错,错误原因:',str(reason))
6 except ZeroDivisionError as reason:
7     print('出错,错误原因:',str(reason))



 

小甲鱼python学习网站_python_06

可以用一个元组捕获多个异常:



1 try:
2     sum = 1/0
3     f = open("nofile.txt") 
4 except (IOError,ZeroDivisionError) as reason:
5     print('出错,错误原因:',str(reason))



 

用while True 和 else 组合,else后的语句在没有异常的情况下才执行,注意缩进,输入错误后会重新输入直到正确:



1 while True:
 2     try:
 3         x = int(input("input first num"))
 4         y = int(input("input first num"))
 5         z = x/y
 6         print(z)
 7     except ZeroDivisionError:
 8         print("error,try again")
 9     else:
10         break



 

不管try语句中是否发生异常,finally语句后都会执行:



1 try:
2     x = int(input("input first num"))
3     y = int(input("input first num"))
4     z = x/y
5     print(z)
6 except ZeroDivisionError:
7     print("error:")
8 finally:
9     print("结束")



 

三十四  else和with

else:

if-else语句:

和各种语言相同的用法,在条件语句中,与if语句搭配使用的else语句。如果if语句的条件表达式的结果布尔值为假,那么程序将执行else语句后的代码。

elif(else-if)语句:

elif是python提供的else-if语句,它检查多个条件表达式的值是否为真,并在为真时执行特定代码块中的代码。和else一样,elif是可选的,但是要注意的是,一个if语句可以跟多个elif语句,但最后只能有一个else语句

while-else/for-else语句:

在其他语言中,除了条件语句,是不会见到else分支的,但在Python中,while和for循环中,也是可以使用else语句的。它们的工作顺序为:在循环中使用时,else语句只在循环完成后执行,也就是说,break语句也会跳过else代码块,只要循环是正常结束,而不是通过break,else语句就会执行

求素数:



1 def fun(num):
 2     count = int(num/2)
 3     while count>1:
 4         if(num%count == 0):
 5             print("%d的最大公约数是:%d" %(num,count))
 6             break
 7         count -= 1
 8     else:
 9         print("%d是素数" %num)
10 
11 n = int(input("请输入一个整数:"))
12 fun(n)



 

执行结果:

小甲鱼python学习网站_爬虫_07

注意:Python中没有自增自减运算符,格式化输出多个字符要用元组的形式

try-else语句:

对于python中的错误和异常,try-except语句段,也可以和else连用,其功能和循环中的else语句没有多大区别:在try范围内没有检测到异常的时候,执行else子句。

 

with:

这个语法是用来代替传统的try...finally语法的。

with EXPRESSION [ as VARIABLE] WITH-BLOCK



1 try:
2     with open("e://1.txt",'r') as f:
3         for each_line in f:
4             print(each_line)
5 except IOError as reason:
6     print("Error:",str(reason))



 如果用finally,若是文件不存在,也要走f.close(),这样的话文件存在打开后会自动关闭

 

模块

(1)import 文件名  比如想导入tmp.py,在主程序中写import tmp,并用tmp.调用函数

(2)from 模块 import 函数(若要引用全部,写*)  在主程序中直接调用函数名

(3)import 文件名 as 别名  在主程序中用 别名. 调用函数

 

if __name__ == "__main__":

简单来说当一个文件作为模块时,在if __name__ == "__main__":语句后的内容不能被调用

原理:

小甲鱼python学习网站_python_08

当作为模块时,可见__name__并不等于__main__,所以之后的东西不会执行,也不能被调用

 

搜索路径:用列表的方式添加或删除

小甲鱼python学习网站_爬虫_09

 

包:创建一个文件夹,文件夹中存放相应模块,文件夹的名字就是包的名字,在文件夹中创建一个__init__.py的模块文件,内容可以为空

使用包,import 包名.模块名

 

标准库

学习一个模块的方法,以timeit模块为例:

1.IDLE中F1,索引

2. IDLE中print(timeit.__doc__)查询模块说明

3. dir(timeit)查询所有用法

4. timeit.__all__查询对外接口

5. timeit.__file__查询源码路径

 

介绍timeit模块

 

爬虫

urllib