看到struct这么英文单词,大家应该并不陌生,因为c/c++中就有struct,在那里struct叫做结构体。在Python中也使用struct,这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换,从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述,进而根据这个格式字符串转换成Python值。
我们知道python只定义了6种数据类型,字符串,整数,浮点数,列表,元组,字典。但是C语言中有些字节型的变量,在python中该如何实现呢?这点颇为重要,特别是要在网络上进行数据传输的话。
python提供了一个struct模块来提供转换。下面就介绍这个模块中的几个方法。
pack(fmt, v1, v2, …) ------ 根据所给的fmt描述的格式将值v1,v2,…转换为一个字符串。
unpack(fmt, bytes) ------ 根据所给的fmt描述的格式将bytes反向解析出来,返回一个元组。
calcsize(fmt) ------ 根据所给的fmt描述的格式返回该结构的大小。
struct.pack():
struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, …),参数fmt是格式字符串,关于格式字符串的相关信息下面有所介绍。v1, v2, …表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):
import struct
a=20
b=400
str=struct.pack(‘ii’,a,b) #转换成字节流,虽然还是字符串,但是可以在网络上传输
print len(str) #ii 表示两个int
8 #可以看到长度为8个字节,正好是两个int型数据的长度
print str
#二进制是乱码
1
print repr(str)
‘\x14\x00\x00\x00\x90\x01\x00\x00’ #其中十六进制的 0x00000014, 0x00001009分别表示20和400
由此我们就可以任意的进行组包了,比如下面一个打包的例子,只介绍其中的pack
format = “!HH%ds” % len(data)
buffer = struct.pack(format,opcode,blocknumber,data)
我们要对一个数据进行打包,加上一些个包头,我们根据下面的格式符信息,知道H是unsigned short是2个字节,而s是char型。所以这个buffer就是2个字节的opcode,2个字节的blocknumber,和len长的char。
Python模块——struct(字节流,组包拆包实现)
struct.unpack():
我们接着上面的例子运行:
a1,a2=struct.unpack(‘ii’,str)
print ‘a1’,a1
a1 20
print ‘a2=’,a2
a2= 400
可以看到 “ii”以四个字节为分界,把8个字节的str分成了两个int型的整数。
struct.calcsize():用来计算特定格式的输出的大小,是几个字节,比如:
struct.calcsize(‘HH4s’)
8
struct.calcsize(‘ii’)
8
format=‘!HH%ds’ % len(‘hello python’)
struct.calcsize(format)
16