优雅、清晰和务实都是python的核心价值观,如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析( List comprehensions)和生成表达式,通过这两个操作,我们可以看到这三个观点是如何在python中和谐统一起来的。


列表解析

在需要改变列表而不是需要新建某列表时,可以使用列表解析。列表解析表达式为:


1. [expr for iter_var in iterable]   
2. [expr for iter_var in iterable if cond_expr]  
 
  
 第一种语法:首先迭代iterable里所有内容,每一次迭代,都把iterable里相应内容放到iter_var中,再在表达式中应用该iter_var的内容,最后用表达式的计算值生成一个列表。
 第二种语法:加入了判断语句,只有满足条件的内容才把iterable里相应内容放到iter_var中,再在表达式中应用该iter_var的内容,最后用表达式的计算值生成一个列表。
 举例如下:
 
  
1. >>> L= [(x+1,y+1) for x in range(3) for y in range(5)]   
2. >>> L  
3. [(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5)] 
 
  
1. >>> N=[x+10 for x in range(10) if x>5]  
2. >>> N  
3. [16, 17, 18, 19] 
 
  
1. newlist=[x+5 for x in olderlist if x>10] 
 
  
 一个更复杂的例子:
 
  
1. <span style="font-size: 14px;">>>> num = [j for i in range(2, 8) for j in range(i*2, 50, i)]  
2. >>> num  
3. [4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 6,
4.  9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 8, 12, 16, 20, 24, 28, 32, 36, 40, 
5. 44, 48, 10, 15, 20, 25, 30, 35, 40, 45, 12, 18, 24, 30, 36, 42, 48, 14, 21, 28, 35, 42, 49]  
6. </span>  
 
  
1. >>> words = 'The quick brown fox jumps over the lazy dog'.split()  
2. >>> words  
3. ['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']  
4. >>> stuff = [[w.upper(), w.lower(), len(w)] for w in words]  
5. >>> for i in stuff:  
6.     print i  
7.  
8.       
9. ['THE', 'the', 3]  
10. ['QUICK', 'quick', 5]  
11. ['BROWN', 'brown', 5]  
12. ['FOX', 'fox', 3]  
13. ['JUMPS', 'jumps', 5]  
14. ['OVER', 'over', 4]  
15. ['THE', 'the', 3]  
16. ['LAZY', 'lazy', 4]  
17. ['DOG', 'dog', 3]  
 
  
 上述代码的map()实现:
 
  
1. >>> stuff = map(lambda w: [w.upper(), w.lower(), len(w)], words)  
2. >>> for i in stuff:  
3. ...     print i  
4. ...   
5. ['THE', 'the', 3]  
6. ['QUICK', 'quick', 5]  
7. ['BROWN', 'brown', 5]  
8. ['FOX', 'fox', 3]  
9. ['JUMPS', 'jumps', 5]  
10. ['OVER', 'over', 4]  
11. ['THE', 'the', 3]  
12. ['LAZY', 'lazy', 4]  
13. ['DOG', 'dog', 3] 
 
  
生成器表达式
 生成器表达式是在python2.4中引入的,当序列过长, 而每次只需要获取一个元素时,应当考虑使用生成器表达式而不是列表解析。生成器表达式的语法和列表解析一样,只不过生成器表达式是被()括起来的,而不是[],如下:
 
  
1. (expr for iter_var in iterable)   
2. (expr for iter_var in iterable if cond_expr) 
 
  
 例:
 
  
1. >>> L= (i + 1 for i in range(10) if i % 2)  
2. >>> L  
3. <generator object <genexpr> at 0xb749a52c>  
4. >>> L1=[]  
5. >>> for i in L:  
6. ...     L1.append(i)  
7. ...   
8. >>> L1  
9. [2, 4, 6, 8, 10] 
 
  
 生成器表达式并不真正创建数字列表, 而是返回一个生成器,这个生成器在每次计算出一个条目后,把这个条目“产生”(yield)出来。 生成器表达式使用了“惰性计算”(lazy evaluation,也有翻译为“延迟求值”,我以为这种按需调用call by need的方式翻译为惰性更好一些),只有在检索时才被赋值( evaluated),所以在列表比较长的情况下使用内存上更有效。A generator object in python is something like a lazy list. The elements are only evaluated as soon as you iterate over them.
一些说明:
 1. 当需要只是执行一个循环的时候尽量使用循环而不是列表解析,这样更符合python提倡的直观性。
 
  
1. for item in sequence:  
2.     process(item) 
 
  
 2. 当有内建的操作或者类型能够以更直接的方式实现的,不要使用列表解析。
 例如复制一个列表时,使用:L1=list(L)即可,不必使用:
 
  
1. L1=[x for x in L]


3. 当序列过长, 而每次只需要获取一个元素时,使用生成器表达式。

4. 列表解析的性能相比要比map要好,参考http://www.qingliangcn.com/2010/02/list-comprehensions%E4%B8%8Elist-map%E6%80%A7%E8%83%BD%E5%AF%B9%E6%AF%94/