使用javax.crypto.Cipher库数字签名,输出结果byte[],转化成String类型传输,收到后转化为byte[]类型进行验证数据签名,发现收到的数据长度变了,字符不变。如下所示。


byte转string java 瓶颈 byte转string长度变化_字符编码

很明显字符长度变了,大概猜测就是编码的问题,并且很有可能是单字节编码和多字节编码的问题。于是查看系统默认的编码:如“ISO8859-1”,属于单字节编码,

byte转string java 瓶颈 byte转string长度变化_byte转string java 瓶颈_02

个人猜测:后面的数据变长了,可能是默认使用了双字节编码,所以输出的字符一样,长度却变了。 这是单字节编码,也就是需要用单字节来表示一个字符,所以当字节数组编码成字符串之后,再转回来之后,可能会出现长度变长了的问题,

于是查询了一下,并且试了一下,指定编码格式为"ISO8859-1",确认是可以的。

解决方法:指定编码格式为单字节编码,如"ISO-8859-1"。如下,则可以使用String传输,并收到后转回byte[]类型,将数据用于数据签名的验证了。

byte转string java 瓶颈 byte转string长度变化_安全_03

顺便再属性了一下字节编码问题,具体如下:

关于单字节编码和多字节编码:

计算机中储存的信息都是用二进制数表示的,用8位二进制来表示一个字节,这样一个字节就可以表示2的8次方(256)种不同的变化,即可以表示256个字符。

字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。

字符编码(Character Encoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表),与其他东西的一个集合(如二进制字节码)进行配对。即在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本技术。通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。

单字节编码:一个字节就表示一个字符,比如典型的ASCII码中的所有字符都是单字节编码的。

双字节编码:需要用两个字节来表示一个字符的编码,比如汉字的GBK,GB2312编码。

多字节编码:需要用多个字节来表示一个字符的编码,比如Unicode,UTF-8编码。