一、多元标准高斯分布

高斯分布在机器学习中出现得很频繁。高斯分布被誉为"上帝的分布", 其强悍的建模能力和优美的数学性质使得高斯分布在现实中得到广泛的应用。我们知道, 大量独立同分布的随机变量的均值在做适当标准化之后会依分布收敛于高斯分布, 这使得高斯分布具有普适性的建模能力。

首先是一元高斯分布:

若是随机变量

python 高斯分布概率函数 高斯分布法_机器学习

,则有如下概率密度函数 

python 高斯分布概率函数 高斯分布法_线性代数_02

 如果我们对随机变量X进行标准化,则

python 高斯分布概率函数 高斯分布法_机器学习_03

 从而有

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_04

 此时随机变量Z是有X得来的,

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_05

服从一元标准高斯分布,其均值

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_06

,其方差

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_07

,其概率密度函数为:

python 高斯分布概率函数 高斯分布法_深度学习_08

 随机变量 X 标准化的过程, 实际上的消除量纲影响和分布差异的过程. 通过将随机变量的值减去其均值再除以标准差, 使得随机变量与其均值的差距可以用若干个标准差来衡量, 从而实现了不同随机变量与其对应均值的差距, 可以以一种相对的距离来进行比较。标量进行标准化一方面的原因就是方便比较。

 而多元标准高斯分布的概率密度函数就是由一元高斯分布导出的。假设我们有随机变量

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_09

,其中,

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_10

,其

python 高斯分布概率函数 高斯分布法_机器学习_11

相互独立。即随机向量中的每个随机变量

python 高斯分布概率函数 高斯分布法_深度学习_12

都服从标准高斯分布且两两彼此独立,则结合上文的一元高斯分布,我们可得随机向量

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_09

的联合概率密度函数为:

python 高斯分布概率函数 高斯分布法_深度学习_14

 我们成随机向量

python 高斯分布概率函数 高斯分布法_线性代数_15

,即随机向量服从均值为零向量, 协方差矩阵为单位矩阵的高斯分布.。在这里,随机向量

python 高斯分布概率函数 高斯分布法_线性代数_16

的协方差矩阵是

python 高斯分布概率函数 高斯分布法_机器学习_17

组成的矩阵

python 高斯分布概率函数 高斯分布法_深度学习_18

 由于随机向量

python 高斯分布概率函数 高斯分布法_线性代数_15

,所以其协方差矩阵的对角线元素为1,其余元素为0.如果我们取常数

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_20

,则可得函数

python 高斯分布概率函数 高斯分布法_线性代数_21

的等高线为

python 高斯分布概率函数 高斯分布法_机器学习_22

,当随机向量

python 高斯分布概率函数 高斯分布法_python 高斯分布概率函数_23

由此可知,其等高线以(0,0)为圆心的同心圆。

python 高斯分布概率函数 高斯分布法_线性代数_24

 

二、多元高斯分布

 

python 高斯分布概率函数 高斯分布法_机器学习_25

 这里讨论的就是一般情况。即向量

python 高斯分布概率函数 高斯分布法_线性代数_26

,即

python 高斯分布概率函数 高斯分布法_概率密度函数_27

,且

python 高斯分布概率函数 高斯分布法_线性代数_28

彼此并不独立的普通情况,接下来的操作就是我们需要将不符合要求的

python 高斯分布概率函数 高斯分布法_线性代数_26

使其符合要求,也就是使 

python 高斯分布概率函数 高斯分布法_线性代数_28

彼此相互独立。从而求得其概率密度函数。

 通过一系列的操作,我们可以得到联合概率密度函数的最终表达形式:

python 高斯分布概率函数 高斯分布法_线性代数_31

python 高斯分布概率函数 高斯分布法_概率密度函数_32

 

 原本由定理1, 我们还需要求线性变换矩阵 B, 才能确定随机向量 

python 高斯分布概率函数 高斯分布法_概率密度函数_33

 的联合概率密度函数的表达式, 现在可得最终形式, 随机向量 

python 高斯分布概率函数 高斯分布法_概率密度函数_33

 的联合概率密度函数由其均值向量 

python 高斯分布概率函数 高斯分布法_线性代数_35

 和其协方差矩阵 

python 高斯分布概率函数 高斯分布法_机器学习_36

 唯一确定, 但我们需要明白的是, 这是通过定理1的线性变换 

python 高斯分布概率函数 高斯分布法_机器学习_37

 得到的, 即此线性变换隐含其中.