转载原地址 http://blog.csdn.net/hikean/article/details/9749391
快速幂或者矩阵快速幂在算指数时是很高效的,他的基本原理是二进制,下面的A可以是一个数也可以是一个矩阵(本文特指方阵),若是数就是快速幂算 法,
若是矩阵就是矩阵快速幂算法,用C++只需把矩阵设成一个类就可以,然后重载一下乘法就可以,注意为矩阵是则ANS=1,应该是ANS=E,E是单位 矩阵,
即主对角线是1其余的部分都是0的特殊方阵了。
举个例子若你要算A^7你会怎么算一般你会用O(N)的算法A^7=A*A*A*A*A*A*A也许你觉得这并不慢但是若要你算 A^10000000000000000呢,
是不是会觉得O(N)的算法也太慢了吧这不得算死我啊,计算机也不想算了,因为有更高效的算法我们把A的指数 写成二进制,这样就有了
A^7=A^111(2) 现在我们可以这么算 令ANS=1;MULTI=A ,N=7
while(N)
{
if(N%2==) //亦可以写成N&1 或N%2
ANS*=MULTI;
MULTI*=MULTI;
N/=2;//c++中可以写成 N>>=1;直接用位运算更快
}
写出上面的代码的执行过程就是
ANS=1;MULTI=A;
N=7 ;N%2=1; ANS*=MULTI; 所以ANS=A; MULTI*=MULTI; 所以MULTI=A^2
然后 N/=2;N=3; N%2=1; ANS*=MULTI; 所以 ANS=A*A^2=A^3 ; 又MULTI*=MULTI; 所以MULTI=A^4
然后N/=2;N=1;N%2=1;ANS*=MULTI; 所以 ANS=A*A^2*A^4=A^7;又MULTI*=MULTI; 所以MULTI=A^8
然后N/=2;N=0;算法结束 是不是很巧妙呢,实际上用的乘法次数是 6次你可能觉得,那个A^7=A*A*A*A*A*A*A,不也是用了6次乘法吗有什么区别?
那是因为这个算法是log2(n) (表示以2为底n的对数) 的复杂度,还有一个系数,大约是2 实际上计算次数就是 2*log2(n) 而普通的连乘计算的复杂度是n 乘法计算次数是n-1
这样在n很小时差别不大,但随着n的增长差距会迅速扩大,例如 n=1024时 普通方法得计算1023次乘法,但快速幂最多(因为当上面的程序执行时N的中间结果为偶数那么 ANS*=MULTI,
将不会被执行,故实际的计算次数要小于 2*log2(n))只算2*log2(n) =20次乘法,是不是很快!!!!!!!!!!
但是为什么呢?好像还有点不懂。。
实际上A^7=A^1*A^2*A^4这样每次计算乘法乘的因子都是递增的,而且还是指数递增,还有这些因子是可以递推产生的就是可以利用上次的计算每次平方就可以了,
这中其实是使用的二进制的思想,因为任意一个数都可以,表示成二进制,故 A^N以定可以写成
A^(一个二进制数如101010)=A^(100000)*A^(00000)*A(1000)*A^(000)*A^(10)*A^(0)=A^(2^5)*A^(2^3)*A^(2^1)
而我们的MULTI 其实是一个数列 A^1,A^2,A^4,A^8,A^16........即 A^(2^0),A^(2^1),A^(2^2),A^(2^3),A^(2^4).......................
注意到他的指数都是二 进制的位权(不知道是不是这个名词,就像十进制的位权是 1 10 100 1000 10000,一样如1243=1*1000+2*100+3*10+4*1;
而二进制的1011 是 1*2^(3)+0*2^(2)+1*2^(1)+1*2^(0) 这样是不是应该理解位权了呢?)实际上任何一个A^N都可以写成这个数列的某些项的乘积,
因为N始终都可以表示成二进制,而把N表示成二进制后如果某项为 1则说明需要乘上MULTI 否则不用乘上MULTI
于是就有了上面的代码,,,,哎怎么感觉我说的还是很不清楚呢?那就没办法
下面附上代码,另外一般要用快速幂的题都要取模 因为指数太大的数是会爆掉int 和long long 的
#include<iostream> using namespace std; #define mod 1000000007 long long quick_pow(int n,int base) //n是指数 base是底 即计算的是base^n 当然结果是取模了的 { long long ans=1;//默认ans大于等于1因为不能算负指数 long long multi=base; while(n) { if(n%2) ans*=multi; ans%=mod;//由于数太大一般要取模 n/=2; multi*=multi; multi%=mod; } return ans; } int main() { int n,base; while(cin>>n>>base) cout<<quick_pow(n,base)<<endl; return 0; }
可能你会问了这个算法有什么用呢?其实用的更多是使用矩阵快速幂,算递推式,注意是递推式,简单的如斐波那契数列的第一亿项的结果模上10000000后 是多少你还能用递推式去,逐项递推吗?当然不能,这里就可以发挥矩阵快速幂的神威了,那斐波那契数列和矩阵快速幂能有一毛钱的关系?答案是有而且很大
斐波那契的定义是f(1)=f(2)=1; 然后f(n)=f(n-1)+f(n-2) (n>=2) 我们也可以这样定义f(1)=f(2)=1; [f(n),f(n-1)]=[f(n-1),f(n-2)][1,1,1,0],其中[1,1,1,0] 是一个2*2的矩阵 上面一行是1,1,下面一行是1,0,这样就可以化简了写成[f(n),f(n-1)]=[f(2),f(1)]*[1,1,1,0]^(n-2)
这样就可以用矩阵快速幂,快速的推出斐波那契数列的第一亿项的值了(当然是取模的值了)是不是很神奇,类似的递推式也可以,化成这种形式,用矩阵快速幂进行计算
下面附一个矩阵快速幂的代码,当然所有矩阵都是要模的
# include<cstdio> # include<cstring> using namespace std; #define NUM 50 int MAXN,n,mod; struct Matrix//矩阵的类 { int a[NUM][NUM]; void init() //将其初始化为单位矩阵 { memset(a,0,sizeof(a)); for(int i=0;i<MAXN;i++) a[i][i]=1; } } A; Matrix mul(Matrix a,Matrix b) //(a*b)%mod 矩阵乘法 { Matrix ans; for(int i=0;i<MAXN;i++) for(int j=0;j<MAXN;j++) { ans.a[i][j]=0; for(int k=0;k<MAXN;k++) ans.a[i][j]+=a.a[i][k]*b.a[k][j]; ans.a[i][j]%=mod; } return ans; } Matrix add(Matrix a,Matrix b) //(a+b)%mod //矩阵加法 { int i,j,k; Matrix ans; for(i=0;i<MAXN;i++) for(j=0;j<MAXN;j++) { ans.a[i][j]=a.a[i][j]+b.a[i][j]; ans.a[i][j]%=mod; } return ans; } Matrix pow(Matrix a,int n) //(a^n)%mod //矩阵快速幂 { Matrix ans; ans.init(); while(n) { if(n%2)//n&1 ans=mul(ans,a); n/=2; a=mul(a,a); } return ans; } Matrix sum(Matrix a,int n) //(a+a^2+a^3....+a^n)%mod// 矩阵的幂和 { int m; Matrix ans,pre; if(n==1) return a; m=n/2; pre=sum(a,m); //[1,n/2] ans=add(pre,mul(pre,pow(a,m))); //ans=[1,n/2]+a^(n/2)*[1,n/2] if(n&1) ans=add(ans,pow(a,n)); //ans=ans+a^n return ans; } void output(Matrix a)//输出矩阵 { for(int i=0;i<MAXN;i++) for(int j=0;j<MAXN;j++) printf("%d%c",a.a[i][j],j==MAXN-1?'\n':' '); } int main() { freopen("in.txt","r",stdin); Matrix ans; scanf("%d%d%d",&MAXN,&n,&mod); for(int i=0;i<MAXN;i++) for(int j=0;j<MAXN;j++) { scanf("%d",&A.a[i][j]); A.a[i][j]%=mod; } ans=sum(A,n); output(ans); return 0; }