Python数据类型(python3)

基础数据类型


  • 整型 <class 'int'>
  • 带符号的,根据机器字长32位和64位表示的范围不相同,分别是:
  • -2^31 - 2^31-1 和 -2^63 - 2^63 -1
  • Python为了程序运行速度,使用了小整数对象池,避免整数对象的频繁申请和销毁,增加程序运行速度的开销。也就是声明多个小整数赋值给变量,这些变量都是指向的小整数对象池里面的那个小整数对象。相反大整数都会重新实例一个在内存中。

>>>id(258)
1971357673680
>>>id(258)
1971357675120
>>>id(258)
1971357672720
#以上三次实例的整数都是单独的
>>>id(256)
1390248128
>>>id(256)
1390248128
#以上两次实例的小整数都是同一个实例

  • .
  • 所谓小整数是[-5,257)的左闭右开区间。
  • 而对于大整数也会有个对象池,将没有使用的保留在对象池中,不会销毁,有需要的时候直接被使用。
  • 整数对象能进行算数运算,特别的是%取模,和divmod(a,b) -> (整除数,余数) 形式的一个元组tuple
  • 多种表示方式
  • 二进制binary:0b111011
  • 八进制octonary:0o7237
  • 十进制decimalism:10392049
  • 十六进制hexadecimal:0xAB23CF
  • 进制转化间使用bin(),oct(),hex()
  • 浮点<class 'float'>
  • 即分数,有限小数和无限循环小数
  • 之所以叫浮点,是按照科学计数法表示时,小数点位是可变的1.23*109
  • 不精确,默认是17位精度。如果都是用严格的科学计数法表示的话,那么小数点后能表示16位,小数点前只有1位
  • 当需要更高精度,超过16位,那么就得使用decimal模块。1st,先使用getcontext(位数)设置精确位数,然后在使用Decimal(1.232)对象来表示小数并使用其进行算数运算,最后得到的也是Decimal对象
  • 如果用格式化字符串来设定精确位数,会非常的不准确。

>>> a = "%.30f" % (1.0/3)
>>> a

'0.333333333333333314829616256247'

  • 字符串<class 'str'>
  • 字符串也是序列,很多序列的工厂函数都可以使用
  • 字符串是不可变对象,immutable,可以hash,可以做字典key
  • 表示法:
  • 单引号,双引号,三对单/双引号
  • r"dsf" 表示的字符,取消引号中的特殊字符意义
  • u"kdsjf"表示unicode编码的字符串,在python3中等同于普通字符串表示法;但在python2中这就是一种单独类型的数据对象,叫unicode。所以蛋疼的python2和python3在字符编码上让人头晕。好了,这里我们只提python3,那python3多了一个bytes类型,因为是独立的一个类型,但是还是是序列的一种。下面说:
  • b'sdfs' 在python3中这个可不是字符串,是bytes。应该可以认为是可以表示数据流。python2中就是字符串。
  • 在python3中通过str.encode()转换为bytes,通过bytes.decode()转换为str。和两个方法互转。
  • 字符串工厂方法:
  1. string.capitalize() -> str 首字母大写剩下的变小写
  2. string.center(self,width,fillchar=None) -> str 返回一个指定字节宽度,string在中间,其它有填充字符填充
  3. string.count(self,sub,start=None,end=None) -> int
  4. string.encode(self,encoding='utf-8',errors='strict') -> bytes
  5. string.endwith(self,suffix,start=None,end=None) -> bool
  6. string.startwith(self,prefix,start=None,en=None) -> bool
  7. string.expandtab(self,tabsize=8) -> str 将字符串中tab字符转换为指定个数的空格字符
  8. string.find(self,sub,start=None,end=None) -> int 最小的索引值sub在string之一
  9. string.format(self,*args,**kwargs) -> str 将string中{}无论根据名字还是数字使用函数参数进行替换。
  10. string.index(self,sub,start=None,end=None) -> int 不同于find的是,没有不会返回-1而是抛出ValueError异常。
  11. string.isalnum()-> bool 字符串不为空且都是字母和数字
  12. string.isdigit()-> bool
  13. string.isalpha()-> bool
  14. string.isdecimal() -> bool 是否是十进制证书
  15. string.isidentifier() -> bool 是否是关键字字符
  16. 序列的特性都有
  • python3解释器默认utf-8编码,是支持对utf-8的转码为unicode的。python2就需要显示指定编码。同样python3的源码如果是gbk的编码,那么也是需要在文件头添加gbk的编码指定,代码加载到内存中后会转码为unicode

>>>import sys
>>>print(sys.getdefaultencoding())
utf-8

  • .
  • 编码不能说太多了,太多只有看网上大牛的文章了。
  • 字符的编码查看ord('s')返回字符的unicode编码十进制,通过chr(103923)返回十进制编码对应的字符。
  • 对于小于4个字节字符串使用一个类似小整数的字符串对象池。
  • 还有大于4个字节字符串也有想大整数类似的字符串对象缓冲池,而且提供intern()方法手动都指定同一个字符串实例。


  • 布尔<class 'bool'>
  • False True
  • 隐含bool值:[] {} 0 () '' 0 None 0.0 0j 作False, 其它所有非空的数据都可以作True,还有 instances of user-defined classes,if the class defines a __bool()__ or __len__() method,when that method returns the integer zero or bool value False.
  • 空值
  • None 什么都没有

其它常用类型(进行ing)


  • 列表list
  • mutable可变数据类型,不能hash不能做key,属于序列即有序的,可以嵌套,有深浅copy一说的特性,可迭代。
  • 列表相当于一个容器,存放其它数据类型对象,列表容器也有容器自己的内存地址,列表中的是有序的存放其它数据的内存地址。
  • 通过列表生成式,产生一个列表实例
  • a = [] ; b = list(可迭代对象/单个元素/无参数) 来实例化一个列表对象。
  • 支持通用的可迭代对象遍历方式
  • 支持:
  • 索引访问(正反);
  • 切片(可自定步长第三个表示步长)->返回一个新列表存着切片出来的元素,原列表没变化。隐含有浅copy,虽然是切片部分copy。就是改变子列表元素,原列表也看的见改变的元素。
  • 追加append(从列表尾部压入)-> 改变列表
  • 删除:1) list.remove(元素)根据元素删 2) del list[idx1][idx2]根据索引删... ->改变列表
  • 取出:pop(ele) ->改变列表。和删除针对列表上,都是将元素移除列表。两者不同的是:删除是内存中删除了;取出是从列表移除,在内存中还是存在的,只是可以被其它变量引用。
  • 插入:list.insert(idx,ele)-> 改变列表
  • 列表长度:len(list) -> 不改变列表
  • 判断元素在列表容器中没:'seve' in list -> False or True 应该是判断有没相等的,而不是判断是否同一个对象。
  • 删除多个元素:del list[1:n]
  • list.clear() 清空列表 字典也有这个功能
  • 元组tuple
  • immutable,可hash,有序
  • t = (2,) 一个元素需要在后加上一个逗号,表明是元组,不然等价于没有() ; tt = tuple(可迭代对象/无参数) 来实例化一个元组对象。
  • 上面一条意思是:a = ('str') <=> a = 'str' 两种方式变量都是class 'str'而不是tuple 这点在声明元组时就最好使用tuple(可迭代对象)函数
  • 可以使用元组进行多变量赋值: a, b = (1, 2) # unpack
  • 支持:
  • 索引访问(正反);
  • 切片同list
  • tuple长度:len(tuple)
  • 判断元素是否在tuple中: 'seven' in tuple
  • 字典dict
  • mutable,可变的不能hash,是map映射的一种,好像python唯一映射类型。
  • 通过key->value 就是一种不可变数据对象映射另一个任意数据对象。
  • 实例字典对象:

实例方式

说明

d1 = {key1:value1,key2:value2}

直接

d2 = dict(name='seven', age=20)

间接通过dict()之关键字参数方式

d3 = dict(mapping)

间接通过dict()之带入一个mapping对象

d4 = dict(iterable)

间接通过dict()之带入一个可迭代并且每次迭代出一个二元的序列的对象,如 iterable = ('ab','cd','ef') -> dict(iterable) == {'a': 'b', 'c': 'd', 'e': 'f'},这种的反向操作是d4.items()

  • key必须不可变,在字典中唯一;字典是无序的。
  • 方法(python3):
  • dict.keys() -> key的迭代对象,可list()
  • dict.values() -> value的迭代对象,可list()
  • dict.items() -> 返回key,value二元组的可迭代对象
  • len(dict)-> 返回字典键值对个数
  • dict.clear() 清空字典 可变容器都有这个功能
  • dict.setdefault(k,None) 不存在就设置default值,这样添加就不会因为key冲突而报异常
  • dict.pop(key[,defaultvalue]) 和list.pop()类似,取出key对应的值,没有key就返回defaultvalue,没有default值抛异常
  • dict.get(self,k,d=None) 返回key对应的值,没有key返回default值,默认default为None
  • dict.copy() a shallow浅 copy of dict
  • dict.popitem(self) -> 返回键值对元组
  • dict.update(E,**F) 如果给了一个字典参数,那么使用参数字典的key更新dict有相同的key;如果是关键字参数,类似的,参数名作k,值做v,更新dict
  • 集合set
  • 可变,剔重,集合运算,set(),元素没顺序,因为元素必须唯一,所以集合中不能出现可变数据类型,如容器list,容器dict.
  • 强调集合本身也是一个容器,是可变的。可以通过frozenset()实例不可变集合。
  • 用处除了检查成员资格,还可以集合运算,剔重可迭代对象。
  • s1 = {1,2,3} s2 = set(可迭代对象)
  • in not in
  • 集合运算:
  • s1和s2并集: s1 | s3 ; s1.union(s2)
  • s1 s2 交集: s1 & s2 ; s1.intersection(s2)
  • s1 s2 对称差集: s1^s2 ; s1.symmetric_difference(b)
  • s1 差集 s2 : s1-s2 ; s1.difference(s2)
  • 集合包含关系:
  • 集合相等或不等: = ; !=
  • 集合s1 包含 s2: s1>=s2 ; s1.issuperset(s2)
  • 集合s1 包含于s2: s1<=s2 ; s1.issubset(s2)
  • 集合s1 不相交于 s2: s1.isdisjoin(s2)
  • 集合常用操作:
  1. set.add() 添加元素
  2. set.pop() 从集合中取出元素
  3. set.update() 将新元素和原集合并集的新集合
  4. set.clear() 清空集合
  5. set.copy() 浅copy
  6. set.remove() 删除元素,没有报异常
  7. set.discard() 删除元素,没有不报异常
  • collections模块
  • 深浅copy(copy.deepcopy())/enumerate(,索引起点)/rang()/is not is/split join/zip()/