1. 一 概述
  2. 二对称加密和非对称加密
    1. 对称加密
    2. 非对称加密
    3. 区别
  3. 三RSA原理
    1. 整数运算
    2. 同余运算
    3. 当模数为合数n时
    4. 当模数为质数p的时候
    5. 离散对数问题
    6. RSA原理

一 , 概述

在现代密码学诞生以前,就已经有很多的加密方法了。例如,最古老的斯巴达加密棒,广泛应用于公元前7世纪的古希腊。16世纪意大利数学家卡尔达诺发明的栅格密码,基于单表代换的凯撒密码、猪圈密码,基于多表代换的维吉尼亚密码,二战中德军广泛使用的恩格玛加密机….但最终都找到了有效的破解算法。

现代密码学的诞生标志是1977年1月由美国国家标准局公布的数据加密标准(Data Encryption Standard,DES)。 
在经过20多年之后,为适应现代的安全要求,2000年美国国家和标准技术协会筛选和评测出了被称为AES(Advanced Encryption Standard)的加密算法作为新的加密标准。目前,AES已被广泛使用,且未发现致命缺陷。到目前为止,AES是一个安全的加密算法。

然而,在加密算法之外,面临一个问题,那就是:秘钥的分发。就是说,解密方如何获得加密方的秘钥呢? 从而出现了:对称加密和非对称加密。

二,对称加密和非对称加密

1. 对称加密

对称加密指的就是加密和解密使用同一个秘钥,所以叫做对称加密。对称加密只有一个秘钥,作为私钥。  
常见的对称加密算法:DES,AES,3DES等等。

2. 非对称加密

非对称加密指的是:加密和解密使用不同的秘钥,一把作为公开的公钥,另一把作为私钥。公钥加密的信息,只有私钥才能解密。私钥加密的信息,只有公钥才能解密。 
常见的非对称加密算法:RSA,ECC

3. 区别

对称加密算法相比非对称加密算法来说,加解密的效率要高得多。但是缺陷在于对于秘钥的管理上,以及在非安全信道中通讯时,密钥交换的安全性不能保障。所以在实际的网络环境中,会将两者混合使用.

例如针对C/S模型, 
1. 服务端计算出一对秘钥pub/pri。将私钥保密,将公钥公开。 
2. 客户端请求服务端时,拿到服务端的公钥pub。 
3. 客户端通过AES计算出一个对称加密的秘钥X。 然后使用pub将X进行加密。 
4. 客户端将加密后的密文发送给服务端。服务端通过pri解密获得X。 
5. 然后两边的通讯内容就通过对称密钥X以对称加密算法来加解密。

三,RSA原理

我们先来看这样一些基础知识,并且以下我们讨论全都是整数:

整数运算

在整数运算中 我们定义一个整数x,那么他的负数为-x,并且有x+(-x)=0;

他的倒数为x−1 , 并且有x×x−1 =1;

同余运算

有整数a,b,正整数m。 假如a除以m余b。我们称为a模m同余b,模数为m。并且记为a≡b(modm) ,例如10除以3余1

我们称10模3同余1,记为10≡1(mod3) 。

我们分别讨论模数为合数和质数情况下,基于同余运算的负数和倒数。

1. 当模数为合数n时

简单起见,我们讨论当n为10的情况,10是两个质数乘积

当模数为10的时候,参与运算的都是小于10的数。因为大于10的数除模取余之后都会小于10,所以只需要考虑小于模的数。

那么在同余运算中

一个小于10的数a,他的负数x是什么? 也就是说使得(a+x)≡0(mod10) ; 那就是n−a,即x=n−a。这里的x就像是常规运算下的-a。常规运算下a+(−a)=0,我们说−a是a的负数,这里(a+x)≡0(mod10),我们说x是a的负数。;

有a+(n−a)=a+(−a)+n=n≡0(modn) 。 当n=10的时候 ,有如下表

a 0 1 2 3 4 5 6 7 8 9
x 0 9 8 7 6 5 4 3 2 1

那么,a的倒数a−1是什么呢? 它要使得a×a−1在模数为n的情况下等于1,即a×a−1≡1(modn)

当n=10的时候我们会发现,对于有的数我们可以找到它的倒数,有的数却找不到

例如当a=3,我们可以找到7,使得3×7=21≡1(mod10) ;

而当a=4的时候,我们有4×0=0,4×1=4,4×2=8,4×3=12,4×4=16,4×5=20,4×6=24,4×7=28,4×8=32,4×9=36,在模10的情况下,都不会等于1。

我们对于所有小于10的a都找他的倒数a−1,有下表 

a 1 2 3 4 5 6 7 8 9
a−1 1 不存在 7 不存在 不存在 不存在 3 不存在 9

有什么规律呢?

数学界已证明:当a<n时,只有当a和n互质才能找到a−1。 同时还有以下结论,当n=p×q ,且p和q都为质数时,所有小于n的数中,能找到倒数的个数为(p−1)×(q−1)个。如果n有更多的质因子,那么计算会更复杂点。

我们把所有小于n,并且能和n互质的数的总个数记为一个函数φ(n) ,这个函数叫做欧拉函数。例

即当n=p×q ,且p和q都为质数时,有φ(n)=(p−1)×(q−1), 那么就有φ(10)=(2−1)×(5−1)=4

同时这些数还有以下两个有趣的情况

  1. 这些数之间进行互乘的同余运算,结果还是这些数。

    例如对于1:1×1≡1(mod10), 1×3≡3(mod10), 1×7≡7(mod10), 1×9≡9(mod10)

    对于3:3×1≡3(mod10), 3×3≡9(mod10), 3×7≡1(mod10), 3×9≡7(mod10)

    对于7:7×1≡7(mod10),7×3≡1(mod10),7×7≡9(mod10),7×9≡3(mod10)

    对于9:9×1≡9(mod10),9×3≡7(mod10),9×7≡3(mod10),9×9≡1(mod10)

    如果一些数在互相运算之后,得到的结果还是这些数中,我们称这些数在这个运算条件下具有封闭性。

  2. 对这些数进行求幂运算,并且再模10,结果如下表

a 1 3 7 9
a0 1 1 1 1
a1 1 3 7 9
a2 1×1=1 3×3=9 7×7=9 9×9=1
a3 1×1×1=1 3×3×3=7 7×7×7=3 9×9×9=9
a4 1×1×1×1=1 3×3×3×3=1 7×7×7×7=1 1×1×1×1=1

其中,

  • 我们规定a0≡1(mod10)

  • 所有aφ(10)的结果都为1,即有aφ(n)≡1(mod10)。(根据前面的介绍可知这里的φ(10)=(2−1)×(5−1)=4)

  • 对于3和7来说,他们的a0、a1、a2、a3刚好把1,3,7,9各得到了一遍。到a4时刚好又回到了1,如果大于4之后,又会开始循环

    在模n的情况下一定能找到一个数g,使得g0、g1、g2、……gφ(n)−1刚好把所有与n互质并且小于n的数各得到一遍。我们把满足这种条件的数称为 生成元。

2. 当模数为质数p的时候

当模p为质数的时候,我们假设p=7时。

同样求小于 p 的数 a 的负数 x 使得(a+x)≡0(mod10)有如下表

a 1 2 3 4 5 6
x 6 5 4 3 2 1

而求a的倒数时,因为p是质数,所有小于p的数都和它互质。所以,所有小于p的数a都能找到它的倒数−a。它的欧拉函数φ(n)=p−1。

如下表

a 1 2 3 4 5 6
a−1 1 4 5 2 3 6

它同样有模数为合数n时的性质

  1. 这些数在同余运算规则下进行乘法运算,同样具有封闭性
  2. 任意的a求幂依然满足aφ(n)=1的规则,且同样有生成元

3. 离散对数问题

前面我们得到了有这么一个结论:

在模n的情况下一定能找到一个数g,使得g0, g1 ,g2、……gφ(n)−1刚好把所有与n互质并且小于n的数各得到一遍。我们把满足这种条件的数称为 生成元。

那么,在模n的条件下,给定它的生成元g,以及一个小于n的正整数a。通过一个叫做同余幂的算法能够快速的算出ga的值,我们把算得的结果记为b。 即我们在模n的条件下,能够快速的算出b=ga的值。

由于生成元的特性,我们知道,在模n的条件下,给定生成元g,以及b的值,一定存在一个小于n的正整数a,使得b=ga。那么如何求a的值?

我们发现,这个问题没有任何规律。例如,当n=11,g=2时,有如下表

g 2 2 2 2 2 2 2 2 2 2 2
b=ga 1 2 3 4 5 6 7 8 9 10 1
a 0 1 8 2 4 9 7 3 6 5 10

在实数计算中,我们知道当b=ga时,a=logbg。然而这个计算在模n的条件下非常困难。这样一个问题被称为离散对数问题。在目前的技术条件下,这是一个极为困难的计算。当这个n值达到十进制两三百位时,即便是有大型计算机的情况下,所要花费的时间依然是个天文数字。

4.RSA原理

当n=p×q,p与q是两个大质数。只知道n的值,想要计算p和q,这是一个世界性的极为困难的数学难题。RSA的基础就是基于的n的两个质数分解难题。

具体过程如下:

  • Alice选择两个大质数p和q,求得n=p×q。计算φ(n)=(p−1)×(q−1),接下来,Alice选择一个与φ(n)互质的数e,并计算e−1在模为φ(n)下的值,将计算出的值记为s。

    我们知道,e与φ(n)互质,所以一定存在e−1, 这一步,service 就算出了公钥和私钥,其中,公钥为(e,n),私钥为(s,n)

  • 接下来,Bob可以在非安全信道请求Alice获得公钥。Evl通过中间攻击,只能获得(e,n),以及密文D。假定Bob需要发送的内容为m,计算D=me(modn),然后把D发送给Alice

  • Alice收到D之后,计算me(e−1)(modn)=me×e−1(modn)≡m(modn).

其中,在不安全信道中传输的是n和e。然而,p和q只有Alice才知道,即便Eval获得了n,基于质数分解难题,他无法算出p和q,也就无法算出私钥s来揭秘被加密的消息。 
且,m不能是大于n的数,当m大于n时可以拆分之后分段加密。

举个例子吧

  • 假设取两个质数p=11, q=13,那么n=143. 
    φ(n)=(p−1)∗(q−1)=120。 
    随意选取一个和φ(n)互质的数e,假定这个数字为7,即e=7, 
    那么e−1=63,使得e∗e−1再模n等于1,即e∗e−1≡1(modn).
  • 公钥为(e,n),即(7,143)。 
    私钥为(s,n), 即(63,143)。 
    要加密的原始数据为m,假设m=13。(计算机中任何数据,最后传输或者保存都会转换成二进制的数据)
  • 加密过程:Bob请求Alice,获得公钥,密文为D,  D=137(mod143)=117。 Bob将D传输出去。
  • Evl通过中间攻击,只能获得(e,n),以及密文D
  • 解密过程:Alice获得D,通过只有Alice才有的私钥进行解密。11713(mod143)=13,获得了原始数据。

这里的11和13比较小,知道公钥为(7,143)之后,容易将143做因式分解求的11与13,从而可以算出e−1。但是当p和q是两个非常大的的质数的时候,就很难将其分解出来。 这样,就无法算出e−1。从而不能从密文中获得原始数据。

Write the code ,change the world!