递归长度前缀编码,是一种用长度作为前缀标明编码对象中元素个数的编码方法。
它是以太坊序列化所采用的编码方式,RLP主要用于以太坊中数据的网络传输和持久化存储。
JSON编码
type Student struct{
Name string `json:"name"`
Sex string `json:"sex"`
}
s := Student{Name:"icattlecoder",Sex:"male"}
bs,_ := json.Marsal(&s)
print(string(bs))
// {"name":"icattlecoder","sex":"male"}
变量s
序列化的结果是{"name":"icattlecoder","sex":"male"}
,字符串长度35,实际有效数据是icattlecoder
和male
,共计16个字节,我们可以看到JSON的序列化时引入了太多的冗余信息
RLP编码
type Student struct{
Name string
Sex string
}
s := Student{Name:"icattlecoder",Sex:"male"}
buff := bytes.Buffer{}
rpl.Encode(&buff, &s)
print(buff.Bytes())
// [210 140 105 99 97 116 116 108 101 99 111 100 101 114 132 109 97 108 101]
如下图所示,RLP编码的开头即是此编码中的对象个数(Object num)。
在个数后,是相应个数的对象(Object)。
递归地,每个对象,也是RLP编码,其格式也与下图相同。
需要特别注意的是,在RLP编码中。每个Object的字节大小是不固定的,Object num只表示Object的个数,不表示Object的字节长度。
RLP通过一种长度前缀与递归结合的方式,理论上可编码任意个数的对象。
下图是一个区块的RLP编码,在对区块进行编码时,先递归至最底层,对多个sealer进行编码,多个sealer被编码并加上长度前缀后,编码成为一串RLP编码(sealerList),此编码又作为一个对象,被编入上层的一串RLP编码(blockHeader)中。此后层层递归,最后编码成为区块的RLP编码。
由于RLP编码是递归的,在编码前,无法获知编码后的长度。
RLP编码定义与规则
https://segmentfault.com/a/1190000011763339