局部性原理的引用
由于上面的多模块存储器和双端口RAM优化后的速度与CPU差距任然很大
所以需要更高的存储单元的设计
局于局部性原理和cache的优化
所以引进了Cache-主存的层次
空间局部性和时间局部性
空间局部性:在最近的未来要用到的信息,很可能与现在使用的信息相邻
时间局部性:在最近的未来要用到的信息,很可能是现在正在使用的信息
比如一段代码
这段代码中如果没有cache的话那么如果说取出a[i]和存回a[i]的时间都为1000ns,加法用5ns的话,那么总的用时为1000x2005ns=2005us
如果有cache的话,那么主存将数据存入cache为1000ns,cache花5ns到CPU,CPU计算5ns,CPU将计算后的数据存回cache5ns。故一共为1000+(5+5+5)x10=1150ns.
性能分析:
原因为一些数据放入了cache中
所以引入下面的cache的映射和cache的命中率以及cache的替换算法以及写策略。
命中率,缺失率,tc为命中的访问时间tm为未命中的访问时间ta为平均时间
例题
若采用的是先访问cache后访问主存的方式的话:
不命中的时候,访问cache消耗的时间为t,发现不命中后再访问的时间为5t故所有时间为6t
故平均时间为0.95xt+0.05x6t=1.25t
性能提高为5/1.25-1=3倍