3.1数据类型

分为数字,文本,音频,图像,视频

计算机内部的数据

  位(bit,binary digit)时存储在计算机中的最小单位。他是0或1。

位模式

  为了表示数据的不同类型,应该使用位模式,他是一个序列,有时也被称为位流。通常长度为8的位模式被称为1字节

3.2.1存储整数(定点表示法)

定点表示法用于存储整数,在这个表示法里,小数点是假定的,但并不存储。

但是,用户或程序可能将整数作为小数部分为0的实数存储,这是可能的,当整数太大以至于无法定义为整数来存储。为了更有效的利用计算机内存,无符号和有符号的整数在计算机中存储方式是不同的。

整数通常使用定点表示法存储在内存中

无符号整数[0,+)

最大无符号整数的值为2n-1(n表示计算机中分配用于表示无符号整数的二进制位数)

 

1)存储无符号整数

步骤:1.将整数变成二进制数

   2.如果二进制位数不足n位,则在二进制数的左边补0,使它的总位数为n位。如果位数大于n,则会导致溢出。

3)溢出

  可以理解为首尾相连的数字[0,15]共4个位当15+1时,结果则会溢出为0

4)无符号整数的应用

寻址,存储其他类型

 

符号加绝对值表示法

这种格式在存储整数中并不常用,但该格式用于在计算机中存储部分实数。

1)表示方法:

  有效范围[0,2n-1]被分成了两个相等的子范围,前半个表示正整数,后半个表示负整数。注意:这里面有两个0:正0和负0。此表示法中,需要用1位来表示符号(0正1负),所以在n位单元中可存储的数字范围是[-(2n-1-1),+(2n-1-1)]

 

2)溢出情况同上

3)应用

  符号加绝对值表示法不用于存储整数,而用于存储部分实数,此表示法通常用于采样模拟信号,比如,音频

二进制补码表示法(此表示法中只有一个0)

表示方法:无符号整数的有效范围[0,2n-1]被分为两个相等的子范围,第一个子范围用来表示非负整数,第二个子范围用来表示负整数。这两半按照左负右正的常规互相交换。此表示方法中,最左位决定符号,0正1负。

 

反码和补码

反码:反转各个位

补码:从右向左复制位,直到有1被复制,接着,反转其余的位(反码+1)

1)以二进制补码格式存储整数

  将整数变成n位的二进制数

  如果整数为非负数,则以其原样存储,如果是负数,则取其补码存储。

2)以二进制补码格式还原整数

  如果最左位为1,则取其补码,如果最左位为0,则原样取出。

  将该整数转换为十进制。

溢出情况同上

 

实数

浮点表示法:允许小数点浮动,我们可以在小数点左右有不同数量的数码。

一个数字的浮点表示法由3部分组成:符号,位移量和定点数

第一部分是符号,+/-

第二部分显示小数点应该左右移动构成实际数字的位移量

第三部分是小数点位置固定的定点表示法

eg:+   7.425  X  1021(+7.425E21)

   符号 定点部分    位移量(21)

 

规范化

在一个二进制数规范化之后,只存储一个数的三部分信息:符号,指数,尾数。

eg:  符号  指数  尾数

    +    26 X 1.000333

    +     6     000333

  1和小数点是隐藏的,没有存储

符号:一个数的符号可以用一个二进制位来存储(0或1)

指数:指数定义为小数点移动的位数,幂可正可负,余码表示法是用来存储指数位的方法

尾数:指小数点右边的二进制数。尾数是作为无符号整数存储的。(书后还有一段p话,感觉矛盾,如果后面讨论到则回来补充)

 

余码

在该系统中,正的和负的整数都可以作为无符号数存储。为了表示正的或负的整数,一个正整数(一个偏移量)加到每一个数字中,将它们统一移到非负的一边。这个偏移量的值是2m-1-1,m是内存单元存储指数的大小。

eg

我们可以用4位存储单元在数字系统中表示16个数,分为[-7,-1]0[1,8],其中增加7个单位到每个整数中,可以统一的把数往右移。新系统称为余7,或者偏移量为7的偏移表示法。(自行脑补图像)

IEEE标准

单精度的浮点数

                 S           E           M

余127码 符号1位 指数8位 尾数23位

双精度的浮点数

余1023码 符号1位 指数11位 尾数52位

 

IEEE标准浮点数的存储步骤:

1.在S中存储符号

2.将数字转换为二进制

3.规范化

4.找到E和M的值

5.连接S,E,M

 

还原请自行解决

备注:书中的上溢和下溢有问题(个人觉得)

存储文本

ASCII

美国信息交换标准码,该代码使用7位表示每个符号,即定义了27个符号。

Unicode

使用32位来表示一个符号 最多可以表达232个符号。

 

存储音频

1.采样:在模拟信号上选择数量有限的点来度量他们的值并记录下来。

2.量化:将样本的值截取为最接近的整数值的一种过程。

3.编码:编码成位模式。

 

存储图像

光栅图:

扫描和像素

解析度:图像扫描中,每个单位上的像素量。

色彩深度:用于表现像素的位的数量。1.真彩色,使用24位来编码一个像素,每个RGB用8位表示。

                 2.索引色,从大的色彩集中选择一些颜色(通常是256种)并对其简历索引,对选中的颜色赋0~255之间的值。

文件体积大,易失真

 

矢量图:

一个图像被分解成几何图形的组合,每个几何形状由数学公式来表达。矢量图是由定义如何绘制这些形状的一系列命令构成的。