概述
Python 读写文件的二进制数据比 C/C++ 语言复杂得多。主要差别在于需要进行 bytes 类型和其它基础数据类型(比如 int/float)的转换。
转换工具在一般情况下都是使用 struct 库。
读出数据
在 open 函数中使用 rb 作为 mode 打开文件,再用 struct.unpack 函数解析 bytes 数据。
具体可以参考 open 函数和 stuct.unpack 函数的说明。
数据文件中二进制数据如下图所示:
import struct
# rb 表示以二进制形式打开文件
with open(r"D:\temp\test.raw", mode="rb") as f:
# 移至指定字节位置
f.seek(3)
# 读入 16 个字节
a = f.read(16)
# 打印 a 类型 bytes
print(type(a))
# 打印 a 内字节数目
print(len(a))
# 打印 a 内数据,以 16 进制数显示
print(a)
# 16 个字节解析为 4 个 unsigned short 数据和 2 个 unsigned int 数据,字节排序为小端,返回元组
val_tuple = struct.unpack("<4H2I", a) # 如果解析 1 个数据,则应当读取与数据存储空间大小一致的字节数目,unpack 仍返回元组
print(val_tuple)
# 将元组转为 list
val_list = list(val_tuple)
print(val_list)
<class 'bytes'>
16
b'\x00\x80\x02\x00\x00\xe0\x01\x00\x00\x00\xb0\x04\x00\xf8\x12\xf1'
(32768, 2, 57344, 1, 78643200, 4044552192)
[32768, 2, 57344, 1, 78643200, 4044552192]
另一种仅可用于整数的单个数据转换方式是使用 int.from_bytes 函数。
# rb 表示以二进制形式打开文件
with open(r"D:\temp\test.raw", "rb") as f:
# 读入 4 个字节
a = f.read(4)
# 小端有符号整数
b = int.from_bytes(a, byteorder='little', signed=True)
print(b)
print(type(b))
16
<class 'int'>
写入数据
在 open 函数中使用 wb 或者 ab 作为 mode 打开文件,再用 struct.pack 函数将数据转化为 bytes 数据后写入。
具体可以参考 open 函数和 stuct.unpack 函数的说明。
import struct
# rb 表示以二进制形式打开文件
with open(r"D:\temp\test_wr.raw", "wb") as f:
val_list = [32768, 2, 57344, 1, 78643200, 4044552192]
a = struct.pack("<4H2I", *val_list) # 注意根据 pack 函数定义,必须用 * 对 list 解包
print(a)
f.write(a)
b'\x00\x80\x02\x00\x00\xe0\x01\x00\x00\x00\xb0\x04\x00\xf8\x12\xf1'
完成写入后的文件内数据如下图所示:
另一种写入单个整数的数据转换方式是使用 int.to_bytes 函数:
import struct
# 用 ab 进行追加写入
with open(r"D:\temp\test_wr.raw", "ab") as f:
val = 16
# 转化为 2 字节大端元符号整数
a = val.to_bytes(length=2, byteorder='big', signed=False)
# 写入文件
f.write(a)
完成写入后的文件内数据如下图所示: