字符编码

常见换算单位:

   比特 bit 位,计算机中最小的表示单位

   字节1bytes =8bit ,最小的存储单位,1bytes缩写为1B,一个字节能表示的最大的整数就是255
   千字节 1KB=1024B

   兆字节 1MB=1024KB

   千兆字节  1GB=1024MB

   太字节 1TB=1024GB    

 

ASCII编码:1个字节

字母A:用ASCII编码是十进制的65,二进制的01000001;

字符0:用ASCII编码是十进制的48,二进制的00110000;

汉字“中”:已经超出了ASCII编码的范围,需要使用Unicode表示

 

 

Unicode编码:2个字节

汉字“中”:Unicode编码是十进制的20013,二进制的01001110 00101101。

字母A:Unicode编码是二进制的00000000 01000001。

 

 

UTF-8编码:常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节;

  UTF-8编码是可边长编码,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节(如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间)