《流畅的Python》笔记。
本篇是“面向对象惯用方法”的第六篇,也是最后一篇。本篇将讨论Python中的运算符重载。
1. 前言
Python中的运算符重载和C++中的运算符重载并不一样,C++中同一运算符可以有多个重载函数,Python中的运算符重载其实是实现运算符的同名特殊方法。
本篇只讨论一元运算符和中缀运算符,内容如下:
- Python如何处理中缀运算符中不同类型的操作数;
- 使用鸭子类型或白鹅类型处理不同类型的操作数;
- 中缀运算符如何表明自己无法处理操作数;
- 众多比较运算符的特殊行为;
- 增量运算符的默认处理方式和重载方式。
不过,需要说明的是,并不是所有的运算符都能重载:
- 不能重载内置类型的运算符;
- 不能新建运算符,只能重载现有的;
-
is
,and
,or
和not
不能重载。
本文中的示例延用《Python学习之路29》中的多维向量Vector
。
2. 一元运算符
本节主要介绍4个一元运算符,它们分别是:
-
-
(__neg__
):一元取负运算符,如x = 2
,则-x == 2
; -
+
(__pos__
):一元取正运算符,通常是x == +x
,但也有特例; -
~
(__invert__
):对整数按位取反,定义为~x == -(x + 1)
; -
abs()
函数:Python语言参考手册把它也列为了一元运算符,它对应的就是之前多次用到的__abs__
。
在实现过程中需要遵循这些运算符的一个基本规则:始终返回一个新对象!也就是说不能修改self
,要创建并返回合适类型的实例。以下补充两个Vector
类的运算符重载:
def __neg__(self):
return Vector(-x for x in self)
def __pos__(self):
return Vector(self)
复制代码
x
和+x
何时不等?以下是两个例子:
- 如果
decimal.Decimal
所在上下文的精度不同,则有可能不等,如下:
>>> import decimal
>>> ctx = decimal.getcontext()
>>> ctx.prec = 40
>>> one_third = decimal.Decimal("1") / decimal.Decimal("3")
>>> one_third
Decimal('0.3333333333333333333333333333333333333333')
>>> one_third == +one_third
True
>>> ctx.prec = 28 # 这是默认精度
>>> one_third == +one_third
False
>>> +one_third
Decimal('0.3333333333333333333333333333')
复制代码
collections.Counter
在相加时,负值和零值计数会从结果中剔除,而一元运算符+
对它来说等同于加上一个空Counter
,如下:
>>> ct = Counter("abracadabra")
>>> ct["r"] = -3
>>> ct["d"] = 0
>>> ct
Counter({'a': 5, 'b': 2, 'c': 1, 'd': 0, 'r': -3})
>>> +ct # 与ct不等
Counter({'a': 5, 'b': 2, 'c': 1})
复制代码
3. 重载向量加法运算符+
目前版本的Vector
不支持向量相加,因为没有重载+
运算符。我们的要求如下:
- 它能实现两个
Vector
相加,并且两个长度不等的Vector
也能相加,短的那个用0.0
填充; - 能与任何可迭代对象相加,但当这个可迭代对象中的元素不能与浮点数做加法运算时,则抛出
NotImplemented
异常;
def __add__(self, other):
try:
pairs = itertools.zip_longest(self, other, fillvalue=0.0) # 自动填充
return Vector(a + b for a, b in pairs)
except TypeError:
# 它不是一个异常类,而是一个单例值!所以用的是return,而不是raise
return NotImplemented
def __radd__(self, other): # 实现反向相加
return self + other
# 在控制台中运行的示例,省略了import语句
>>> v1 = Vector([1, 2, 3])
>>> v1 + Vector([2, 3, 4]) # 可以和同类型的相加
Vector([3.0, 5.0, 7.0])
>>> v1 + (1, 2, 3) # 和其他可迭代对象也能相加
Vector([2.0, 4.0, 6.0])
>>> v1 + (1, 2) # 长度不同也能相加
Vector([2.0, 4.0, 3.0])
>>> v1 + Vector2d(1, 2) # 由于我们之前实现的Vector2d也是可迭代对象,所以也能和Vector相加
Vector([2.0, 4.0, 3.0])
>>> (1, 2, 3) + v1 # <1> 反向也能相加,见解释
Vector([2.0, 4.0, 6.0])
复制代码
解释:
- 像
__radd__
,__rsub__
这种前面带r
的方法一般被称作“反向”运算方法或“右向”运算方法,如果没有实现这种方法,上述代码<1>
处的语句就会抛出TypeError
; - 对于表达式
a + b
来说,解释器会执行如下几步:
- 如果
a
有__add__
方法,调用a.__add__(b)
; - 如果
a.__add__(b)
返回NotImplemented
,或者a
没有__add__
方法,则检查b
有没有__radd__
方法,如果有,则调用b.__radd__(a)
; - 如果
b.__radd__(a)
返回NotImplemented
,或者b
没有__radd__
方法,则抛出TypeError
,并在错误消息中指明操作数类型不支持。
其他有反向运算方法的运算符在调用时也是上面这个逻辑。
__radd__
等反向运算的实现通常就如上述代码这么简单暴力:直接委托给正向运算。- 在实现
__add__
时,我们并没有去判断other
的类型或者它的元素的类型,而是捕获TypeError
异常。这是在给other
调用反向运算方法的一个机会。如果调用成功,other
就能被当做另一个操作数的“同类”,这也遵循了鸭子类型精神。
4. 重载乘法运算符
4.1 重载数乘运算*
这里实现的是向量的数乘运算,我们希望任何实数都能和Vector
做数乘预算(也叫做元素级乘法, elementwise multiplication),添加的两个方法如下:
def __mul__(self, scalar):
if isinstance(scalar, numbers.Real):
return Vector(n * scalar for n in self)
else:
return NotImplemented
def __rmul__(self, scalar):
return self * scalar
# 以下是在控制台中运行的示例
>>> v1 = Vector([1,2,3])
>>> 2 * v1
Vector([2.0, 4.0, 6.0])
>>> v1 * True # bool是int的子类
Vector([1.0, 2.0, 3.0])
>>> from fractions import Fraction
>>> v1 * Fraction(1, 3)
Vector([0.3333333333333333, 0.6666666666666666, 1.0])
复制代码
解释:这里并没有像__add__
中那样,采用鸭子类型技术,在__mul__
中捕获TyperError
;而是采用更易于理解和更合理的方式,即白鹅类型,使用isinstance()
函数来判断操作数是否为实数。
4.2 重载点乘运算@
从Python3.5开始,已经支持点乘运算符@
,它相应的特殊方法时__matmul__
(矩阵乘法”matrix multiplication”的缩写),以下是对点乘运算的重载:
def __matmul__(self, other):
try:
return sum(a * b for a, b in zip(self, other))
except TypeError:
return NotImplemented
def __rmatmul__(self, other):
return self @ other
# 下面是它的运行示例:
>>> Vector([1, 2, 3]) @ Vector([4, 5, 6])
32
>>> [1, 2, 3] @ Vector([4, 5, 6])
32
复制代码
5. 比较运算符
Python对比较运算符的处理与前文类似,不过在两个方面有重大区别:
- 正向和反向调用使用的是同一系列方法,即没有
r
前缀。例如,对于==
来说,正向和反向调用都是__eq__
方法,只是掉换个参数;正向的__gt__
方法调用的则是反向的__lt__
方法,并调换参数。 - 对
==
和!=
来说,如果反向调用失败,Python会比较对象的ID,而不是抛出TypeError
。
5.1 重载 ==
之前版本的Vector
中,__eq__
的实现与行为如下:
def __eq__(self, other):
return (len(self) == len(other) and all(a == b for a, b in zip(self, other)))
# 它的行为如下:
>>> Vector([1, 2, 3]) == (1, 2, 3) # 除此之外还能和Vector与Vector2d比较
True
复制代码
有时候我们并不想兼容这么多类型的操作数,但当遇到某些类型时(比如上面的元组),我们也不想武断地直接抛出TypeError
,而是让另一个操作数判断这俩是否相等,于是我们将上述代码改为如下形式:
def __eq__(self, other):
if isinstance(other, Vector):
return (len(self) == len(other) and all(a == b for a, b in zip(self, other)))
else:
return NotImplemented
# 它的行为如下:
>>> va = Vector([1, 2, 3])
>>> t3 = (1, 2, 3)
>>> va == t3
False
复制代码
以下是Vector([1, 2, 3]) == (1, 2, 3)
这段代码的运行过程:
- 为计算
va == t3
,Python调用Vector.__eq__(va, t3)
; - 由于
t3
不是Vector
类,所以上述调用返回NotImplemented
; - Python得到
NotImplemented
结果,尝试调用tuple.__eq__(t3, va)
; - 由于
tuple.__eq__(t3, va)
不知道Vector
是什么,因此返回NotImplemented
; - 对
==
来说,如果反向调用也返回了NotImplemented
,则最后比较对象的ID,发现两者不等,返回False
5.2 重载 !=
!=
不用重载!从object
继承而来的__ne__
已经够用了,由于原版的__ne__
是用C语言写到,下面的代码是它的Python版本:
def __ne__(self, other):
eq_result = self == other
if eq_result is NotImplemented:
return NotImplemented
else:
return not eq_result
复制代码
意思就是:如果__eq__
返回NotImplemented
,那它也返回这个值;否则,返回__eq__
结果的相反值。
6. 增量赋值运算符
其实目前版本的Vector
已经支持了+=
和*=
操作,因为我们为它实现了__add__
,__mul__
操作,当运行a += b
时,会被转换成a = a + b
。但也正因此,大家可以看出,这不是一个就地运算,这样的+=
和*=
会创建新的实例。如果想实现就地预算,则需要重写以i
开头的特殊方法,比如+=
对应的__iadd__
。
由于Vector
被定义为不可变类型,这里我们新建一个简单的MyList
类来示范+=
运算符的重载。为简答起见,以两个操作数的最小长度为准:
>>> class MyList:
... def __init__(self, iterable):
... self._list = list(iterable)
...
... def __iadd__(self, other):
... for i in range(min(len(self._list), len(other))):
... self._list[i] += other[i]
... return self
...
>>> test = MyList(range(10))
>>> id(test)
2848410583560
>>> test
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> test += range(9)
>>> id(test)
2848410583560 # ID没有改变
>>> test
[0, 2, 4, 6, 8, 10, 12, 14, 16, 9] # 确实是就地运算
复制代码
其实这里只为强调一点:增量赋值特殊方法最后一定要返回self
!
7. 总结
本文开篇先介绍了不能重载运算符的情况,随后依次介绍了一元运算符,中缀运算符(包括加法、乘法和比较运算)和增量运算符的重载情况。
其中需要注意NotImplemented
这个值,它不是异常,而是个单例值,Python在进行中缀运算时会专门检测这个值。
期间,我们还讨论了如何处理不同类型的操作数:是按照鸭子类型技术,捕获TypeError
,还是根据白鹅类型,用isinstance
进行类型判断。这两种方式各有利弊:鸭子类型更灵活,但白鹅类型更能预知结果。如果选用isinstance
,则不要检测具体类,而应检测抽象基类,比如numbers.Real
。
最后给出各运算符对应的特殊方法的表格,第一个表格是中缀运算符的名称:
运算符 | 正向方法 | 反向方法 | 就地方法 | 说明 |
|
|
|
| 加法或拼接 |
|
|
|
| 减法 |
|
|
|
| 乘法或重复复制 |
|
|
|
| 除法 |
|
|
|
| 整除 |
|
|
|
| 取模 |
|
|
|
| 返回由整除的商和模构成的元组 |
|
|
|
| 幂运算 |
|
|
|
| 矩阵乘法 |
|
|
|
| 位与 |
|
|
|
| 位或 |
|
|
|
| 位异或 |
|
|
|
| 按位左移 |
|
|
|
| 按位右移 |
下面这个表格是比较运算符的名称:
分组 | 中缀运算符 | 正向方法调用 | 反向方法调用 | 后备机制 |
相等性 |
|
|
| 返回 |
|
|
| 返回 | |
排序 |
|
|
| 抛出 |
|
|
| 抛出 | |
|
|
| 抛出 | |
|
|
| 抛出 |