本篇文章主要是对python学习时的一些总结,作为学习笔记记录。
在程序设计和编程中,会涉及到各种各样的数据类型,而不同的数据类型变量之间可以进行的运算是不同的。在python中,变量的定义虽然不需要声明数据类型,但是并不意味着数据的存储方式是相同的,python中的数据类型是指变量在内存中的对象的类型。
数据类型
python中主要的数据类型有:
- number
- string
- list
- tuple
- set
- dict
- class
其中class为自定义数据类型,除此之外是标准数据类型。
在标准数据类型中,number,string,tuple为不可变类型,list,dict,set为可变数据。
number
number是一种统称,主要包括int,float,complex,bool。
需要注意的是,在C/C++等语言中,会把int分为short,int,long等类型,但是在python中,只有一种int,此时的int相当于C/C++中的长整型。int类型的最大值可以利用sys得到,float类型的最大值可以则可以通过float函数得到:
import sys
print(sys.maxsize)
print(float('inf'))
结果为:
9223372036854775807
inf
上面的结果inf并不是一个字符串,而是一个float类型,可以使用之前提到过的type函数进行验证:
type(float('inf'))
结果为:
float
除了type函数可以查看数据类型之外,还可以使用isinstance函数进行验证:
isinstance(float('inf'),float)
结果为:
True
内建函数isinstance的函数签名为:
isinstance(obj, class_or_tuple, /)
该函数返回值为bool,说明obj是否是类或者子类的一个实例。如果第二个参数是元组的形式,则是判断是否是元组内几种类型的一个,相当于对多个结果进行逻辑或运算。
函数type和isinstance都能够判断对象的类型,但是两者还是有些区别的,主要体现在对类对象的判定上。
class A:
pass
class B(A):
pass
print(type(A()) == A)
print(type(B()) == B)
print(type(B()) == A)
print(isinstance(A(),A))
print(isinstance(B(),A))
print(isinstance(B(),B))
结果为:
True
True
False
True
True
True
从上面的结果可以看出:
- type()不会认为子类是一种父类类型
- isinstance()会认为子类是一种父类类型
运算和运算符
number类型之间的所涉及到的运算主要是一些数值计算,分别为:
print(5 + 3) # 加法
print(5 - 3) # 减法
print(5 * 3) # 乘法
print(5 / 3) # 除法
print(5 // 3) # 整除
print(5 % 3) # 取余
print(5 ** 3) # 乘方
string
python中的字符串可以用单引号,双引号或者三引号括起来进行定义,对于一些特殊字符可以使用转义字符进行转义。但是三引号和但双引号之间也存在一些差异:
a = 'hello world'
b = "hello world"
c = '''hello
world'''
d = """hello
world"""
print(a)
print(b)
print(c)
print(d)
结果为:
hello world
hello world
hello
world
hello
world
从上面的结果可以看出,使用三引号构建的字符串在打印时能够保持原有的格式,可以用来构建多行文本。
随机访问
与C/C++中字符串的随机访问类似,python中的字符串也可以利用[]进行随机访问,但与C/C++中的随机访问仍有区别:
s = 'abcdefghijklmnopqrstuvwxyz'
print(s[0])
print(s[25])
print(s[-1])
print(s[-26])
print(s[0:-1])
print(s[0:])
print(s[0::2])
print(s[-1::-1])
print(s + s)
print(s * 3)
结果为:
a
z
z
a
abcdefghijklmnopqrstuvwxy
abcdefghijklmnopqrstuvwxyz
acegikmoqsuwy
zyxwvutsrqponmlkjihgfedcba
abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz
abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz
从上边的结果可以看出:
- 下标0表示起始字符
- 下标-len也表示起始字符。
- 下标len-1表示末尾字符
- 下标-1也表示末尾字符
- 0:-1不包含末尾字符
- 0:包含末尾字符
- a:b:c的形式中,a表示起始位置,空默认为0,b表示终止位置,空默认为末尾,c表示步长,默认为1,可以借用这种形式实现倒序输出
- + 为字符串连接
- * 为对字符串进行复制
而对于字符串中本身要包含的字符,如果与转义字符的定义发生冲突,则可以在字符串前加上r来消除可能引起的歧义:
a = 'age\name'
print(a)
a = r'age\name'
print(a)
结果为:
age
ame
age\name
在本篇文章的开始提到字符串是不能改变的类型,这一点与C/C++类似,在C/C++中,如果定义了字符指针指向一个字符串,那么不能通过下标值的形式进行改变,在python中这样的操作同样是不允许的。
a = 'hello'
a[1] = '2'
如上边通过[]来修改a的元素值就是不被允许的,因此说python中的字符串是不可变类型。
list
list类似于C/C++中的vector,但是相较于vector有所不同,主要体现在:
- list中元素的数据类型可以不同
- list中元素的类型可以是number,string或者list
- list写在[]之间,元素之间使用逗号分隔
a = [10,'hello',[10,'hello'],(10,'hello'),{'hello':10,'world':20}]
print(a)
结果为:
[10, 'hello', [10, 'hello'], (10, 'hello'), {'hello': 10, 'world': 20}]
随机访问
list中数据的随机访问和string类型是一样的,包括字符串的 + 和 * 操作。
但与string不同,list是可变的类型:
a = [10,'hello',[10,'hello'],(10,'hello'),{'hello':10,'world':20}]
a[0] = 20
print(a)
结果为:
[20, 'hello', [10, 'hello'], (10, 'hello'), {'hello': 10, 'world': 20}]
tuple
tuple与元组类似,但也有所不同:
- tuple写在()中,元素之间用逗号分隔
- tuple中的元素是不可更改的
除此之外,tuple与list的使用方法大致无差。需要注意的是当tuple中只有一个元素时的定义形式:
a = (10,'hello')
b = (20)
c = (20,)
print(type(a))
print(type(b))
print(type(c))
结果为:
<class 'tuple'>
<class 'int'>
<class 'tuple'>
从上边的结果可以看出,当tuple中只存在一个元素时,需要在该元素后多加一个逗号,用来表明这是一个tuple,而不至于被解释成单个变量。
随机访问
tuple中数据的随机访问和string类型是一样的,包括字符串的 + 和 * 操作。
与string类似,tuple是不可变类型,但是这种不可变与string类型的不可变有些许区别:
a = (10,'hello',[10,'hello'],(10,'hello'),{'hello':10,'world':20})
a[2][0] = 20
print(a)
结果为:
(10, 'hello', [20, 'hello'], (10, 'hello'), {'hello': 10, 'world': 20})
从上面的结果可以看出,虽然tuple是不可变类型的,但当tuple中的元素是嵌套的可变数据类型时,又可以改变此嵌套元素的元素。
set
set是由一个或者多个不同的元素构成的,构成set的对象称为元素或成员。
由于set的特性,因此set的基本功能是用来进行成员关系测试或是删除重复元素。set类型的主要特点有:
- set使用{}或者set()函数进行构建
- 创建空set时必须使用set()而不是{},空的{}创建的是dict
- 创建set的元素可以是嵌套类型,但必须是不可变类型
a = set([1,2,3,4])
b = {1,2,3,4}
c = set()
d = {}
e = {1,'hello',(1,'hello')}
print(type(a))
print(type(b))
print(type(c))
print(type(d))
print(e)
结果为:
<class 'set'>
<class 'set'>
<class 'set'>
<class 'dict'>
{1, (1, 'hello'), 'hello'}
运算及运算符
对于set来说,更多的是关注要测试的元素是否在set内,或者是进行set之间的集合运算:
a = set([1,2,3,4])
print(1 in a) # 在
print(5 not in a) # 不在
b = {3,4,5,6}
print(a - b) # 差集
print(a | b) # 并集
print(a & b) # 交集
print(a ^ b) # 并集-交集
结果为:
True
True
{1, 2}
{1, 2, 3, 4, 5, 6}
{3, 4}
{1, 2, 5, 6}
dict
dict与set和list等有所类似,但也有所不同,主要在于:
- list是有序的对象集合,dict则是无序的对象集合
- dict中的元素存储是通过key-value对来存储的,而不是类似于线性存储中的偏移存取的
- dict使用{}标识
- key必须是不可变类型
- key必须唯一
a = {}
a[1] = 'jack'
a['tom'] = 10
print(a)
a[1] = 'jane'
a['tom'] = 'jim'
print(a)
print(a.keys())
print(a.values())
结果为:
{1: 'jack', 'tom': 10}
{1: 'jane', 'tom': 'jim'}
dict_keys([1, 'tom'])
dict_values(['jane', 'jim'])
同时也可以通过dict()函数来进行dict类型的创建:
a = dict([[1,'hello'],['10',30]])
b = dict(tom = 'hello',jack = 30)
print(a)
print(b)
结果为:
{1: 'hello', '10': 30}
{'tom': 'hello', 'jack': 30}
只是如果要使用第二种类型构建dict类型的话,key类型不能为number,string等表达式,需要使用符合命名规范的变量名。
class
class类型此处不做介绍,在后期面向对象的时候会提到。
数据类型转换
既然提到数据类型,当然也会有数据类型的转换,python种内置了几种函数,用来进行各种数据类型之间的转换。
函数 | 描述 |
int(x,[,base]) | 将x转换为一个整数 |
float(x) | 将x转换到一个浮点数 |
complex(real,[,image]) | 创建一个复数 |
str(x) | 将对象 x 转换为字符串 |
repr(x) | 将对象 x 转换为表达式字符串 |
eval(x) | 用来计算在字符串中的有效Python表达式,并返回一个对象 |
tuple(s) | 将序列 s 转换为一个元组 |
list(s) | 将序列 s 转换为一个列表 |
set(s) | 转换为可变集合 |
dict(d) | 创建一个字典。d 必须是一个 (key, value)元组序列。 |
frozenset(s) | 转换为不可变集合 |
chr(x) | 将一个整数转换为一个字符 |
ord(x) | 将一个字符转换为它的整数值 |
bin(x) | 将一个整数转换为一个二进制字符串 |
hex(x) | 将一个整数转换为一个十六进制字符串 |
oct(x) | 将一个整数转换为一个八进制字符串 |