协方差矩阵的特征值

由于求协方差矩阵的特征值具有非常重要的地位,为此,我们专讨论它。

(0)随机变量的方差、两随机变量的协方差

对于随机变量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论的观察值(样本)集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_02,有均值和方差(许多同学总是把方差(估值)中的系数错误地记成了如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_03):
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_04
注:若定义随机变量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论的数学期望如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_06和方差如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_07分别为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_08,则这里的样本均值和样本方差分别为其对应的估值,这时为区别,这里就应改用如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_09,后续情况类似。

若数据集已“中心化” ,则
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_10

设随机变量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_12的样本集分别为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_02如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_14,则可定义
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_15
其中,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_16对应于式(D1),如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_17对应于式(D2),其余类推。

(1)随机向量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_18样本集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19的协方差矩阵

现在把随机变量扩展成随机向量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_20,样本集为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_21,每个分量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_22均为随机变量,将样本集作为矩阵
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_23
其中,矩阵每列是一个向量样本(共如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_24个样本),每行是一个分量的样本集,分量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_22的样本集为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_26
依上述定义,每个分量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_22有上述样本均值和样本方差,两分量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_28间有协方差和相关系数。

现在假定对向量样本集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19的各分量作中心化(即对行作中心化)得到向量样本集为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_30
则由式(D1)、式(D2)有
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_31
其中,右侧除了系数如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_32外,矩阵的主对角线为分量的方差,其他元素为两分量的协方差,因此,定义如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_33为样本集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19的协方差矩阵。

(2)求协方差矩阵不必中心化

如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_35如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19中心化所得,即
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_37
其中,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_38为元素全为1的(列)向量,定义向量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_39,定义各列全为向量如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_40的矩阵如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_41
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_42
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_43
其中,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_44

由此,协方差矩阵
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_45
这说明不需要显式的中心化过程,即可通过式(D10)右边求出样本集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19的协方差矩阵如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_47

(3)通过如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_48的奇异值分解得到如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_49的特征分解

我们讨论如何通过矩阵如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_48的奇异值分解如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_51得到如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_49的特征分解如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_53

由【西瓜书附录式(A.33)】,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_48的奇异值分解表述为如下:
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_55
其中,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_56为对角矩阵。


如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_57
式(D12)即为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_49的特征分解,其中,对角阵
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_59
因为,由式(D12)有
如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_60

如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_61
由式(D15)及特征向量的定义可知,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_如何计算协方差矩阵的特征根R语言_62为特征向量,如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_63为对应的特征值,这就通过如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_48的奇异值分解如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_51实现了如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_49的特征分解如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_67,且特征值为奇异值的平方如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_68,次序为从大到小排序。

实际问题(例如,10.2 低维嵌入(立交桥就是嵌入三维空间中的二维)特征分解进行降维的技巧的式(10.17)中)中,往往最终不是求协方差矩阵如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_47(求它只是过程中的过渡),而是要求出协方差矩阵的特征值(特征矩阵),由(1)知,只需求出如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_70的特征分解。
由(2)知,只需通过如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_71(视作如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_48)的奇异值分解来实现如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_概率论_70的特征分解。 即协方差矩阵的特征分解归结为如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_71的奇异值分解,而奇异值分解又有现成的计算工具。

综上,求样本集如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_19(不必中心化)协方差矩阵的特征矩阵的方法:对如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_矩阵_71进行奇异值分解,得如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_51,再由如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_方差_68组成特征矩阵如何计算协方差矩阵的特征根R语言 协方差矩阵特征值_机器学习_53