• Index

### 关于作者

#### itertools

Python的内建模块`itertools`提供了非常有用的用于操作迭代对象的函数。

``````>>> import itertools
>>> natuals = itertools.count(1)
>>> for n in natuals:
...     print n
...
1
2
3
...
``````

`cycle()`会把传入的一个序列无限重复下去：

``````>>> import itertools
>>> cs = itertools.cycle('ABC') # 注意字符串也是序列的一种
>>> for c in cs:
...     print c
...
'A'
'B'
'C'
'A'
'B'
'C'
...
``````

`repeat()`负责把一个元素无限重复下去，不过如果提供第二个参数就可以限定重复次数：

``````>>> ns = itertools.repeat('A', 10)
>>> for n in ns:
...     print n
...

``````

``````>>> natuals = itertools.count(1)
>>> ns = itertools.takewhile(lambda x: x <= 10, natuals)
>>> for n in ns:
...     print n
...

``````

`itertools`提供的几个迭代器操作函数更加有用：

### chain()

`chain()`可以把一组迭代对象串联起来，形成一个更大的迭代器：

``````for c in itertools.chain('ABC', 'XYZ'):
print c
# 迭代效果：'A' 'B' 'C' 'X' 'Y' 'Z'
``````

### groupby()

`groupby()`把迭代器中相邻的重复元素挑出来放在一起：

``````>>> for key, group in itertools.groupby('AAABBBCCAAA'):
...     print key, list(group) # 为什么这里要用list()函数呢？
...
A ['A', 'A', 'A']
B ['B', 'B', 'B']
C ['C', 'C']
A ['A', 'A', 'A']
``````

``````>>> for key, group in itertools.groupby('AaaBBbcCAAa', lambda c: c.upper()):
...     print key, list(group)
...
A ['A', 'a', 'a']
B ['B', 'B', 'b']
C ['c', 'C']
A ['A', 'A', 'a']
``````

### imap()

`imap()``map()`的区别在于，`imap()`可以作用于无穷序列，并且，如果两个序列的长度不一致，以短的那个为准。

``````>>> for x in itertools.imap(lambda x, y: x * y, [10, 20, 30], itertools.count(1)):
...     print x
...
10
40
90
``````

``````>>> r = map(lambda x: x*x, [1, 2, 3])
>>> r # r已经计算出来了
[1, 4, 9]
``````

``````>>> r = itertools.imap(lambda x: x*x, [1, 2, 3])
>>> r
<itertools.imap object at 0x103d3ff90>
# r只是一个迭代对象
``````

``````>>> for x in r:
...     print x
...
1
4
9
``````

``````>>> r = itertools.imap(lambda x: x*x, itertools.count(1))
>>> for n in itertools.takewhile(lambda x: x<100, r):
...     print n
...

``````

``````>>> r = map(lambda x: x*x, itertools.count(1))

``````

### 小结

`itertools`模块提供的全部是处理迭代功能的函数，它们的返回值不是list，而是迭代对象，只有用`for`循环迭代的时候才真正计算。