数据模型其实是对Python框架的描述,它规范了这门语言自身构建模块的接口,这些模块包括但不限于序列、迭代器、函数、类和上下文管理器。
magic and dunder:魔术方法(magic method)是特殊方法的昵称。有些开发者在提到__getitem__这个特殊方法的时候,会用诸如“下划线--下划线--getitem”这种说法。但会引起歧义,因为像__x这种命名在Python里面也有其他含义。一位大牛用了“双下 -- getitem”这种说法。于是特殊方法也称为双下方法(dunder method)
(一)一摞Python风格的纸牌
Propaedeutics:
Python元组的升级版本 -- namedtuple(具名元组)
因为元组的局限性:不能为元组内部的数据进行命名,所以往往我们并不知道一个元组所要表达的意义,所以在这里引入了 collections.namedtuple 这个工厂函数,来构造一个带字段名的元组。具名元组的实例和普通元组消耗的内存一样多,因为字段名都被存在对应的类里面。这个类跟普通的对象实例比起来也要小一些,因为 Python 不会用 __dict__ 来存放这些实例的属性。
namedtuple 对象的定义如以下格式:
collections.namedtuple(typename, field_names, verbose=False, rename=False)
返回一个具名元组子类 typename,其中参数的意义如下:
typename:元组名称
field_names: 元组中元素的名称
rename: 如果元素名称中含有 python 的关键字,则必须设置为 rename=True
verbose: 默认就好
import collections
from random import choice
Card = collections.namedtuple('Card',['rank','suit'])
class FrenchDeck:
# ranks = [str(n) for n in range(2,11)] + list('JQAK')
rank = [str(n) for n in range(2,11)] + list('JQAK')
suits = 'spades diamonds clubs hearts'.split()
def __init__(self):
self._cards = [Card(rank,suit) for suit in self.suits for rank in self.rank]
def __len__(self):
return len(self._cards)
"""
如果在类中定义了__getitem__()方法,那么它的实例对象(假设为P)就可以这样P[key]取值。
当实例对象做P[key]运算时,就会调用类中的__getitem__()方法。
"""
def __getitem__(self, position):
return self._cards[position]
beer_card = Card('7','diamonds')
print(beer_card) # Card(rank='7', suit='diamonds')
deck = FrenchDeck()
# 使用len()函数查看一叠牌多少张
print(len(deck)) # 52
# 抽取特定的一张牌 ,这都是由__getitem__方法提供的
print(deck[0]) # Card(rank='2', suit='spades')
print(deck[-1]) # Card(rank='K', suit='hearts')
# 随机抽取一张牌,使用内置的随机选出一个元素的函数 random.choice
print(choice(deck))# Card(rank='J', suit='hearts')
print(choice(deck))# Card(rank='5', suit='hearts')
# 由于__getitem__方法把[]操作交给了self._cards列表故支持切片操作(slicing)操作
print(deck[:3]) # [Card(rank='2', suit='spades'), Card(rank='3', suit='spades'), Card(rank='4', suit='spades')]
print(deck[12::13])
# 另外仅仅实现了 __getitem__函数,这摞牌就变成可迭代了
for card in deck:
print(card)
# 方向迭代操作
for card in reversed(deck):
print(card)
# 迭代通常是隐示的,若一个集合类型没有实现__contains__方法,那么in运算符就会按照顺序做一次迭代搜索
print(Card('Q','hearts')in deck)
# 排序操作
suit_values = dict(spades = 3,hearts = 2,diamonds = 1,clubs = 0)
def spades_high(card):
rank_value = FrenchDeck.rank.index(card.rank)
return rank_value * len(suit_values) + suit_values[card.suit]
for card in sorted(deck,key= spades_high):
print(card)
(二)如何使用特殊方法?
首先特殊方法的存在是为了被Python解释器调用的,你自己并不需要调用它。也就是说没有 obj.__len__() 这种写法,而是使用 len(obj) 这种写法。
1、若obj是你自己自定义类对象,Python会去调用你写的__len__方法。
2、若obj是Python内置的类型,比如列表(list)、字符串(str)、字节序列(bytearray)等,那么CPython会抄个近路,__len__实际上会返回PyVarObject里的ob_size属性。PyVarObject是表示内存中长度可变的内置对象的C语言结构体。直接读取这个值比调用方法快的多。
很多时候,特殊方法的调用是隐式的,比如for I in x:这个语句,背后其实用的是iter(x),而这个函数背后则是x.__iter__()方法。当然前提是这个方法在x中被实现了。
(三)模拟数值类型
案例:实现二维向量类
Propaedeutics:
abs:是一个内置的函数,输入整数或浮点数,它返回输入值的绝对值;如果输入是复数(complex number),则返回复数的模。
from math import hypot
class Vector:
def __init__(self,x=0,y=0):
self.x = x
self.y = y
def __repr__(self):
return 'Vector(%r,%r)' % (self.x,self.y)
# hypot 返回欧几里德范数 sqrt(x*x + y*y)
def __abs__(self):
return hypot(self.x,self.y)
def __bool__(self):
return bool(abs(self))
def __add__(self, other):
x = self.x + other.x
y = self.y + other.y
return Vector(x,y)
def __mul__(self, scalar):
return Vector(self.x * scalar,self.y * scalar)
v1 = Vector(2,4)
v2 = Vector(2,1)
print(v1 + v2)
字符串表示形式:
(注:%和str.format这两种字符串的格式化手段都会使用)
在__repr__的实现中,我们用到了%r来获取对象各个属性的标准字符串表示形式——这是个好习惯,它暗示了一个关键:Vector(1,2)和Vector(‘1’,’2’)是不一样的,后者在我们的定义中会报错,因为向量的构造函数直接受数值而非字符串。
__repr__所返回的字符串应该准确、无歧义,并且尽可能表达出如何用代码创建出这个被打印的对象。
__repr__和__str__的区别在于,后者是在str()函数中被使用,或是再用print函数打印一个对象的时候才被调用的,并且返回的字符串对终端用户友好。
若你想实现两个方法中的一个,__repr__是更好选择。如果一个对象没有__str__函数,而python又需要调用它的时候,解释器会用__repr__来代替。
%r:将变量传递到reor()函数中,结果是将变量转化成适合机器阅读的格式
%s:将变量传递到str()函数中,结果是将变量转化成适合人阅读的格式
算术运算:
通过__add__和__mul__,上例为向量类带来了+和*这两个算术运算。值得注意的是,这两个方法的返回值都是新创建的向量对象,被操作的两个向量(self或other)还是原封不动,代码里只读取了它们的值而已。中缀运算符的基本原则就是不改变操作的对象,而是产生一个新的值。
自定义bool值:
为了判定一个值x为真还是为假,Python会调用bool(x),这个函数只能返回True/False。默认情况下,我们始终认为一个对象是True,除非这个类对__bool__或者__len__函数有自己的实现。bool(x)的背后调用的是x.__bool__()的结果;如果不存在__bool__方法,那么bool(x)会尝试调用x.__len__()方法。若返回0则为False,否则返回True。
特殊方法一览表:
类的构造、删除:
object.__new__(self, ...)
object.__init__(self, ...)
object.__del__(self)
二元操作符:
+ object.__add__(self, other)
- object.__sub__(self, other)
* object.__mul__(self, other)
// object.__floordiv__(self, other)
/ object.__div__(self, other)
% object.__mod__(self, other)
** object.__pow__(self, other[, modulo])
<< object.__lshift__(self, other)
>> object.__rshift__(self, other)
& object.__and__(self, other)
^ object.__xor__(self, other)
| object.__or__(self, other)
扩展二元操作符:
+= object.__iadd__(self, other)
-= object.__isub__(self, other)
*= object.__imul__(self, other)
/= object.__idiv__(self, other)
//= object.__ifloordiv__(self, other)
%= object.__imod__(self, other)
**= object.__ipow__(self, other[, modulo])
<<= object.__ilshift__(self, other)
>>= object.__irshift__(self, other)
&= object.__iand__(self, other)
^= object.__ixor__(self, other)
|= object.__ior__(self, other)
一元操作符:
- object.__neg__(self)
+ object.__pos__(self)
abs() object.__abs__(self)
~ object.__invert__(self)
complex() object.__complex__(self)
int() object.__int__(self)
long() object.__long__(self)
float() object.__float__(self)
oct() object.__oct__(self)
hex() object.__hex__(self)
round() object.__round__(self, n)
floor() object__floor__(self)
ceil() object.__ceil__(self)
trunc() object.__trunc__(self)
比较函数:
< object.__lt__(self, other)
<= object.__le__(self, other)
== object.__eq__(self, other)
!= object.__ne__(self, other)
>= object.__ge__(self, other)
> object.__gt__(self, other)
类的表示、输出:
str() object.__str__(self)
repr() object.__repr__(self)
len() object.__len__(self)
hash() object.__hash__(self)
bool() object.__nonzero__(self)
dir() object.__dir__(self)
sys.getsizeof() object.__sizeof__(self)
类容器:
len() object.__len__(self)
self[key] object.__getitem__(self, key)
self[key] = value object.__setitem__(self, key, value)
del[key] object.__delitem__(self, key)
iter() object.__iter__(self)
reversed() object.__reversed__(self)
in操作 object.__contains__(self, item)
字典key不存在时 object.__missing__(self, key)