1.情况1
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <time.h>
#define A 10000
#define B 10
#define num 100000
void main(){
double a[A][B];
double b=0;
int t1=clock();
for (int n=0;n<num;n++)
{
for (int i=0;i<A;i++)
{
for (int j=0;j<B;j++)
{
b=1;
}
}
}
int t2=clock();
for (int m=0;m<num;m++)
{
for (int ii=0;ii<B;ii++)
{
for (int jj=0;jj<A;jj++)
{
b=1;
}
}
}
int t3=clock();
printf("%d %d \n",t2-t1,t3-t2);
}
第一种情况是内外层循环次数相差比较大,这种情况次数少的应该放外循环,循环次数多的应该放内循环。这是因为如果外循环比较大,则内存地址跳跃性比较大,cache命中率比较低,所以会慢点,不过也不是绝对的,可是概率上可能会慢。
2.情况2
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <time.h>
#define A 10000
#define B 10
#define num 10000
void main(){
double a[A][B];
double b=0;
int t1=clock();
for (int n=0;n<num;n++)
{
for (int i=0;i<A;i++)
{
for (int j=0;j<B;j++)
{
a[i][j]=1;
}
}
}
int t2=clock();
for (int m=0;m<num;m++)
{
for (int ii=0;ii<B;ii++)
{
for (int jj=0;jj<A;jj++)
{
a[jj][ii]=1;
}
}
}
int t3=clock();
printf("%d %d \n",t2-t1,t3-t2);
}
第二种情况影响循环效率的主要是访问数组的速度,由于二维数组在内存中是先存放行,然后再存放列。所以在访问数组时,如果先访问行再访问列,则访问地址是连续的,会比较快。但是如果先访问列再访问行,则每次访问数组中元素时,地址跳跃都比较大,cache命中率比较低,在物理内存不足情况下将会分布存储数据,这样每访问一次数组会在不会页面中跳转,内存页面调度和页面交换次数往往会增加,这会大大降低访问速度。