局部性原理和性能分析_主存

局部性原理的引用
由于上面的多模块存储器和双端口RAM优化后的速度与CPU差距任然很大
所以需要更高的存储单元的设计

局于局部性原理和cache的优化
所以引进了Cache-主存的层次

空间局部性和时间局部性
空间局部性:在最近的未来要用到的信息,很可能与现在使用的信息相邻
时间局部性:在最近的未来要用到的信息,很可能是现在正在使用的信息

比如一段代码

int n = 1000l;
for(int i = 0;i <= 1000;i++){
a[i] = a[i] + 2;
}

局部性原理和性能分析_主存_02

这段代码中如果没有cache的话那么如果说取出a[i]和存回a[i]的时间都为1000ns,加法用5ns的话,那么总的用时为1000x2005ns=2005us

如果有cache的话,那么主存将数据存入cache为1000ns,cache花5ns到CPU,CPU计算5ns,CPU将计算后的数据存回cache5ns。故一共为1000+(5+5+5)x10=1150ns.

性能分析:
原因为一些数据放入了cache中

所以引入下面的cache的映射和cache的命中率以及cache的替换算法以及写策略。

局部性原理和性能分析_时间局部性_03
命中率,缺失率,tc为命中的访问时间tm为未命中的访问时间ta为平均时间

局部性原理和性能分析_数据_04
局部性原理和性能分析_数据_05

例题

局部性原理和性能分析_时间局部性_06
局部性原理和性能分析_数据_07

若采用的是先访问cache后访问主存的方式的话:
不命中的时候,访问cache消耗的时间为t,发现不命中后再访问的时间为5t故所有时间为6t
故平均时间为0.95xt+0.05x6t=1.25t
性能提高为5/1.25-1=3倍