首先,让我们退一步看看在写一个for循环背后的直觉是什么:

  1. 遍历一个序列提取出一些信息
  2. 从当前的序列中生成另外的序列
  3. 写for循环已经是我的第二天性了,因为我是一个程序员

幸运的是,Python里面已经有很棒的工具帮你达到这些目标!你需要做的只是转变思想,用不同的角度看问题。

不到处写for循环你将会获得什么

  1. 更少的代码行数
  2. 更好的代码阅读性
  3. 只将缩进用于管理代码文本

看看下面这段代码的构架:

# 1
with ...:
for ...:
if ...:
try:
except:
else:

这个例子使用了多层嵌套的代码, 这是非常难以阅读的 。我在这段代码中发现它无差别使用缩进把管理逻辑(with, try-except)和业务逻辑(for, if)混在一起。如果你遵守只对管理逻辑使用缩进的规范,那么核心业务逻辑应该立刻脱离出来。

“扁平结构比嵌套结构更好” – 《Python之禅》

为了避免for循环,你可以使用这些工具

1. 列表解析/生成器表达式

看一个简单的例子,这个例子主要是根据一个已经存在的序列编译一个新序列:

result = []
for item in item_list:
new_item = do_something_with(item)
result.append(item)

如果你喜欢MapReduce,那你可以使用map,或者Python的列表解析:

result = [do_something_with(item) for item in item_list]

同样的,如果你只是想要获取一个迭代器,你可以使用语法几乎相通的生成器表达式。(你怎么能不爱上Python的一致性?)

result = (do_something_with(item) for item in item_list)

2. 函数

站在更高阶、更函数化的变成方式考虑一下,如果你想映射一个序列到另一个序列,直接调用map函数。(也可用列表解析来替代。)

doubled_list = map(lambda x: x * 2, old_list)

如果你想使一个序列减少到一个元素,使用reduce

from functools import reduce
summation = reduce(lambda x, y: x + y, numbers)

另外,Python中大量的内嵌功能可/会(我不知道这是好事还是坏事,你选一个,不加这个句子有点难懂)消耗迭代器:

>>> a = list(range(10))
>>> a
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> all(a)
False
>>> any(a)
True
>>> max(a)
9
>>> min(a)
0
>>> list(filter(bool, a))
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> set(a)
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> dict(zip(a,a))
{0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}
>>> sorted(a, reverse=True)
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
>>> str(a)
'[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]'
>>> sum(a)
45

3. 抽取函数或者表达式

上面的两种方法很好地处理了较为简单的逻辑,那更复杂的逻辑怎么办呢?作为一个程序员,我们会把困难的事情抽象成函数,这种方式也可以用在这里。如果你写下了这种代码:

results = []
for item in item_list:
# setups
# condition
# processing
# calculation
results.append(result)

显然你赋予了一段代码太多的责任。为了改进,我建议你这样做:

def process_item(item):
# setups
# condition
# processing
# calculation
return result

results = [process_item(item) for item in item_list]

嵌套的for循环怎么样?

results = []
for i in range(10):
for j in range(i):
results.append((i, j))

列表解析可以帮助你:

results = [(i, j)
 for i in range(10)
 for j in range(i)]