ARM体系中存储系统
1. ARM体系中的存储空间
ARM体系使用单一的平板地址空间.该地址空间的大小为232个8位字节.这些字节单元的地址是一个无符号的32位数值,起取值范围为0到232-1.
32位情况:
ARM的地址空间也可以看作是230个32位的字单元.这些字单元的地址可以被4整除,也就是说该地址的低两位为0b00.地址为A的字数据包括地址为A,A+1,A+2,A+3 4个字节单元的内容.
16位情况:
在ARM版本4及以上的版本中,ARM的地址空间也可以看作是231个16位的半字单元.这些半字单元的地址可以被2整除,也就是说该地址的最低位为0b0.地址为A的半字数据包括地址为A,A+1两个字节单元的内容.
地址取模:
各存储单元的地址作为32位的无符号数,可以进行常规的整数运算.这些运算的结果进行232取模.也就是说,运算结果发生上溢出和下溢出是,地址将会发生绕圈.
2. ARM存储器格式
在ARM体系中,每个字单元中包含4各字节单元或者两个半字单元;1各半字单元中包含两个字节单元.但是在字单元中,4各字节哪一个是高位字节,哪一个是低位字节则有两种不同的格式:big-endian格式和little-endian格式.
在big-endian格式中,对于地址位A的字单元包括字节单元A,A+1,A+2,A+3,其中字节单元有高位到低位字节顺序为A,A+1,A+2,A+3;地址为A的字单元包括半字单元A,A+2,其中半字单元有高位到低位字节顺序位A,A+2;地址为A的半字单元包括字节单元A,A+1,其中字节单元有高位到低位字节顺序为A,A+1.这种存储格式如图1.1所示.
在little-endian格式中,地址为A的字单元包括字节单元A,A+1,A+2,A+3,其中字节单元有高位到低位字节顺序为A+3,A+2,A+1,A;地址为A的字单元包括半字单元A,A+2,其中半字单元有高位到低位字节顺序位A+2,A;地址为A的半字单元包括字节单元A,A+1,其中字节单元有高位到低位字节顺序为A+1,A.这种存储器格式如图1.2所示.
31 24 23 16 15 8 7 0
字单元A | |||
半字单元A | 半字单元A+2 | ||
字节单元A | 字节单元A+1 | 字节单元A+2 | 字节单元A+3 |
图1.1 big-endian格式的存储系统
31 24 23 16 15 8 7 0
字单元A | |||
半字单元A+2 | 半字单元A | ||
字节单元A+1 | 字节单元A+2 | 字节单元A+1 | 字节单元A |
图1.2 little-endian格式的存储系统
3. 非对齐的存储访问操作
在ARM中,通常希望字单元的地址是字对齐的(地址的低两位为0b00),半字单元的地址是半字对齐的(地址的最低为0b0).在存储访问操作中,如果存储单元的地址没有遵守上述的对齐规则,则称为非对齐(unaligned)的存储访问操作.
1.非对齐的指令预取操作
当处理器处于ARM状态器件,如果写入到寄存器PC中的值是非字对齐的(低两位不为0b00),要么指令执行的结果不可预知,要么地址值中最低两位被忽略;
当处理器处于Thumb状态器件,如果写入到寄存器PC中的值是非半字对齐的(最低位不为0b0),要么指令执行的结果不可预知,要么的重地值中最低位被忽略.
如果系统中指定,当发生非对齐的指令预取操作时,忽略地址值中相应的位,则有存储系统实现这种”忽略”.也就是说,这时该地址值原封不动的送到存储系统.
2.非对齐的数据访问操作
对于Load/Store操作,如果是非对齐的数据访问操作,系统定义了下面3种可能的结果.
<1>执行的结果不可预知.
<2>忽略字单元地址的低两位,即访问地址为(address and 0xffffffc)的字单元;忽略半字单元地址的最低位的值,即访问地址位(address and 0xffffffe)的半字单元.
<3>忽略字单元地址值种的低两位的值;忽略半字单元地址的最低位的值.有存储体统实现这种”忽略”.也就是说,这时该地址值原封不动的送到存储系统.
当发生非对齐的数据访问时,到底采用上述3种处理方法种的哪一种,是有各指令指定的.
4 指令预取和自修改代码
在ARM中允许指令预取.在CPU执行当前指令的同时,可以从存储器种预取出若干条指令,具体预取多少条指令,不同的ARM实现种有不同的数值.
预取的指令并不一定能够得到执行.比如当前指令完成后,如果发生了异常中断,程序将会跳转到异常中断处理程序处执行,当前预取的指令将被抛弃.或者如果执行了跳转指令,则当前预取的指令也将被抛弃.
正如在不同的ARM实现预取的指令条数可能不同,当发生程序跳转是,不同的ARM实现种采用的跳转预测算法也可能不同.
自修改代码指的是代码在执行过程种可能修改自身.对于支持指令预取的ARM系统,自修改代码可能带来潜在的问题.当指令被预取后,在该指令被执行前,如果有数据访问指令修改了位于主存种的该指令,这是被预取的指令和主存种对应的指令不同,从而可能使执行的结果发生错误.