很多人抱怨说自己写的Python代码跑的慢,尤其是当处理的数据集比较大的时候,其实稍微改动几行代码就可以让你的代码性能提高好几倍,不信一起来看下面这个5个小技巧。
1.for 循环
我们大部分的时候代码里面都有for循环,然后里面嵌套一段逻辑处理,下面有两种方法来完成:
二者的性能差距有多大呢,一般我们用内置的timeit模块来量化比较:
把传统的for改成推导列表,高下立判,性能提高了很多,提升了200%
2.用set而不用list
我们再来看一个常见的场景,搜索性能的时候用set是列表10倍,不信看下面这个例子
原因搜索成员的时候,Python的set比list快很多。差距就在if i in mylist 和if i in myset。列表的复杂度是O(n),而集和的复杂度是O(1),搜索起来肯定是set快!
3.交换if和for的位置
很多时候,我们是在for循环内部进行条件判断,循环一个变量,然后用if/else进行判断。对于这样的情况,可以优化一下,把if/else提到for循环外边,也可以提高性能。
4.巧妙的用try/except语句
很多时候在一个for循环内部,对i进行计算,然后添加到一个list里面,如果能巧妙地利用try/except,可以摆脱对if/else检查的开销,从而提高性能。
5.神器collection模块
collection库提供了很多模块,这些模块非常有用,有一些模块是跟容器有关,大部分的实战项目我们都会用到。比如deque双向队列和defaultdict缺省字典。
1).双向队列deque
deque是双向队列,如果你的业务逻辑里面需要大量的从队列的头或者尾部删除,添加,用deque的性能会大幅提高!如果只是小队列,并且对元素需要随机访问操作,那么list会快一些。
2).缺省字典defaultdict
对于字典的使用,我们要学会用defaultdict来代替,一来是因为有缺省值非常安全,如果访问不存在的key,不会报错;二来是Pyhon性能会大幅提高。