迭代器和生成器都是很重要的知识,因为在后边的同步异步都要用到.

python的迭代协议构成了迭代器.

迭代器是访问集合内元素的一种方式,一般用来遍历数据.

要记住 迭代器和 下标的访问方式不一样,迭代器没有返回值,它取值的方式就是用next().

迭代器提供了一种惰性访问数据方式,访问数据时候才能计算和返回数据.

list 的访问方式是用 getitem 协议,
list 和迭代器 可以用for 循环都是实现迭代协议(iter)这个方法.

我们查找下源码 :

from collections.abc import Iterable,Iterator
class Iterable(metaclass=ABCMeta):
    __slots__ = ()
    @abstractmethod
    def __iter__(self):
        while False:
            yield None

只要有这个 __iter__抽象魔法函数一定可迭代, 咱们再看下Iterator

class Iterator(Iterable):
    __slots__ = ()
    def __iter__(self):
        return  self
     @abstractmethod
    def __next__(self):
        raise StopIteration

大家看下 Iterator 比Iterable 多了一个抽象魔法函数 next,
并且继承了Iterable也重写了iter 抽象方法.

其中 iter 是返回个迭代对象,next 返回下一个数据,在我们访问数据的时候就变成一个迭代器,

迭代器只是比迭代对象多了抽象魔法函数 next, 要记住迭代器也是迭代对象.

咱们 看下 list 源码 :

class list(object):
    """
    list() -> new empty list
    list(iterable) -> new list initialized from iterable's items
    """
    def append(self, p_object): # real signature unknown; restored from __doc__
        """ L.append(object) -> None -- append object to end """
        pass

    def __iter__(self, *args, **kwargs): # real signature unknown
        """ Implement iter(self). """
        pass

list 只重写了 iter 这个魔法函数,所以list 只是个可迭代对象.

具体有什么区别,我们看下边的例子:

>>> x = [1,2,3]
>>> y = iter(x)  #inter是特殊的方法可以把迭代对象变成迭代器,可以查下
>>> z = iter(x)
>>> next(y)   #通过inter方法变成迭代器之后就可以用next方法,如果用 next(x)会报错
1
>>> next(y)
2
>>> next(z)
1
>>> type(x)
<class 'list'>
>>> type(y)   #inter是特殊的方法可以把迭代对象变成迭代器,可以查下
<class 'list_iterator'>

 

上边的iter 和next 与魔法函数的__inter__ 和__next__ 是不一样的,自己可以查下.
只要迭代对象调用了next方法就可以变成迭代器.
迭代器是可以循环输出,直到报错为止.

有人说了 list 是个迭代对象,为什么可以用for循环.

for i in [0,2,3]:
    print(i)

1.首先list 是迭代对象,它只是重写了iter魔法函数,
2.那为什么可以循环输出呢,答案是for 循环自带next 魔法函数

咱们debug 看下:

Iterator = {ABCMeta} <class 'collections.abc.Iterator'>
Iterable = {ABCMeta} <class 'collections.abc.Iterable'>

 

list 用到了for循环的 next,变成个迭代器可以循环输出.

for  i in [1,2,3]:
    print(i)

 

就相当于 :

a=iter([1,2,3,4])

while True:

    try:
      x = next(a);
    except StopIteration:
        break
    print(x)

先调用了iter 从迭代对象变成一个迭代器,然后调用了next 方法.进行遍历.

 

 

1.iter 的用法

咱都知道, list ,tuple,dict 都是可迭代对象,如果想让他们转化成迭代器.
我们可以这么做,调用 inter()方法,它会返回一个迭代器.
例如:

from collections import Iterable,Iterator

a=[1,2]
b=(1,)
c={"name":"Andy"}

print(type(a),type(b),type(c))   #<class 'list'> <class 'tuple'> <class 'dict'>

print(isinstance(a,Iterable),isinstance(b,Iterable),isinstance(c,Iterable))  #True True True
print(isinstance(a,Iterator),isinstance(b,Iterator),isinstance(c,Iterator)) #False False False
a_iterator=iter(a)
b_iterator=iter(b)
c_iterator=iter(c)

print(isinstance(a_iterator,Iterable),isinstance(b_iterator,Iterable),isinstance(c_iterator,Iterable)) #True True True

 

2.getitem 也是模拟的返回一个迭代器

前面我讲过 getitem 这个魔法函数,它可以改变对象类型变成一个iterable ,也就是迭代器

例如:

class Person:
    def __init__(self,persion_list):
        self.persion_list=persion_list
    def __getitem__(self, item):
        return self.persion_list[item]
 
body=Person(["Xiuwu","Adny","Maggie"])

for i in body:
    print (i)

 

上边的代码我们用for循环的时候, 实际上就用了iter()方法 ,不理解可以看看我的上篇写作.

然后看下如下代码

class Person:
    def __init__(self, persion_list):
        self.persion_list = persion_list
    def __iter__(self):
        return  1
    def __getitem__(self, item):
        return self.persion_list[item]


body = Person(["Xiuwu", "Adny", "Maggie"])

body=iter(body)

 

打印结果:

iter() returned non-iterator of type 'int'

 

1.说明 用iter(body)的时候首先找到 ——iter__方法,由于我们返回的不是的个iterator所以报错,
2. __iter__方法找不到,它会继续找 是否有模拟返回迭代器呢,
3. 如果你把__iter__注销掉,它会找到——getitem——

咱们测试下,是否getitem 是否实现iterable ,代码如下:

from collections import Iterable, Iterator


class Person:
    def __init__(self, persion_list):
        self.persion_list = persion_list
    #def __iter__(self):
     #   return  1
    def __getitem__(self, item):
        return self.persion_list[item]


body = Person(["Xiuwu", "Adny", "Maggie"])

print(iter(body))     #<iterator object at 0x0000000002242AC8>
print(isinstance(iter(body),Iterator) #True     说明getitem是可以转化为iterable

如果把getitem 也注销,按道理应该body 不是iterable了,试试
注销之后再运行报错如下:

TypeError: 'Person' object is not iterable

 

证明咱们的想法是对的.

3.分析原理后,咱们就自己写个迭代器.

前面我们已经知道了,迭代器需要重写两个方法,如下:

class Myiterator:
    def __iter__(self):
        pass
    def __next__(self):
        pass

 

如果继承了 Iterator类 ,iter 方法 可以删除.如下:

class Myiterator(Iterator):
    def __next__(self):
        pass

 

这个__next__ 正是我们要重写的取值逻辑

完成的代码如下,解释请看备注:

from collections import Iterable, Iterator

class Person:
    def __init__(self, persion_list):
        self.persion_list = persion_list
    def __iter__(self):
        return  Myiterator(self.persion_list)   #调用我们重写的迭代器方法
    #def __iter__(self):
     #   return  1
    #def __getitem__(self, item):   #把这个方法用我们自己写的迭代器方法替代.
     #   return self.persion_list[item]  
class Myiterator(Iterator):         #继承Iterator 就不需要写__iter__,直接调用父类的.
    def __init__(self,persion_list):
        self.persion_list=persion_list  
        self.index=0      #由于iterator 是没有index 的,这个要我们手动添加
    def __next__(self):   #这个就是迭代器的取值逻辑 
        while True:      #当为false 的时候结束循环
            try:
                word = self.persion_list[self.index]      #取值动作 
            except IndexError:   #index 当变得超出persion_list 会报错的 ,先抓住这个异常
                raise StopIteration     #迭代到没有值要用这异常,咱们把异常做个转化 
            self.index = self.index + 1   #递增我们的index
            return word   #返回取到的值


body = Person(["Xiuwu", "Adny", "Maggie"])

a=iter(body)    #调用我们自定义的迭代器方法 
 print(a)   # <__main__.Myiterator object at 0x00000000022399B0>  
               #从打印结果看说明我们自定义的迭代器方法生效了,已经返回一个迭代器

print(next(a))  #Xiuwu  
                       #从打印结果我们判断出 __next__生效,如果想循环输出,自己试试for 循环.