一、定义
2个字节一个汉字,比如“的”; 全角标点2个字节,半角标点一个字节, 一个字母一个字节
字符指一个字母或一个字或一个标点或一个符号,不一定几个字节,看情况定 字呢,太泛了一点吧?
二、单位换算飞
一个汉字=两个位(2Byte)
一个英文字母=一个位(1Byte)
8bit(位)=1Byte(字节)
1024Byte(字节)=1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
三、各种编码中字符与字节的转换
字节是计算机得度量单位,八个二进制数字组成一个字节,英文名为BYTE
字符是计算机可以处理得符号得统称,比如1234..9及!@#$及abcd...z这种ASCII字符,以及"我是中国人"这种gb2312字符或者UNICODE字符
字符的大小可以用字节来衡量,比如ASCII字符的长度就是一个字节;gb2312字符得长度是两个字节;UNICODE字符得长度是3个字节。
ASCII 一个英文字母,数字-----占7/8字节,就是7个2进制位,第八个有其他用,比如奇偶校验,因此可以算占一个字节。(8个Bit位)
一个中文字-------占二个字节
整数要根据类型,一般是极其的字长。比如16位机整数就是16位Bit,两个字节。32位机就是4字节。还有int64 类型的整数。 至于实数在C中,有32位(float)和64位(double)之分。其他语言中有类型80位的,叫扩展精度实数.主要是在cpu内部的扩展精度实数寄存器,是80位的。保证在double实数运算是不损失精度。
附:文件编码-ANSI与UTF-8
ANSI的ASCII字符集,使用7 bits来表示一个字符,总共表示128个字符.
UTF8 Unicode字符集,它固定使用16 bits(两个字节)来表示一个字符,共可以表示65536个字符 为了双字节的Unicode能够在现存的处理单字节的系统上正确传输,出现了UTF-8.
一个正常的网页有两种编码,一种是让浏览器识别文字的编码,另一种就是页面的自身编码.