- 随机过程(2.1)—— 多维随机变量(随机向量)
- 多维高斯分布是一种特殊的多维随机分布,应用非常广泛。本文参考【机器学习】【白板推导系列】
文章目录
- 1. 定义
- 2. 理解
- 2.1 几何意义
- 2.2 参数数量
- 3. 特征函数
- 4. 性质
- 4.1 边缘分布
- 4.2 分量独立性
- 4.3 线性变换
- 5. 综合例题
1. 定义
- 若 维 r.v. 的概率密度函数为
其中 为 阶实对称正定矩阵(所有特征值 > 0),则称随机向量 服从期望为 ,协方差矩阵为 的多维正态分布,记为 - 注意这里 是一个协方差矩阵,展开为
显然它 是实对称矩阵,通常情况下(只要 。这种实对称正定矩阵是一种正定 hermitian 矩阵,可以做乔里斯基分解 ( - 显然 在任意取值下都是非负的,下面证明 ,这个证明中用到两个技巧
- 上面提到的
- 向量对向量求导会得到一个 Jacobi 行列式,令 ,则
2. 理解
2.1 几何意义
- 的概率密度函数 ,关注其中的指数部分,这是一个二次型,设为
首先明确 尺寸为 , 尺寸为 ,,可以看作 和
注意 是实对称矩阵,一般情况下(
- 正定对称
乔里斯基分解
:,其中 - 正定对称
LDL分解
:,其中 是一个对角阵, - 实对称
正交相似于其特征值组成的对角阵
,即 ,其中 是正交矩阵(有 ),其列向量为 的特征向量,( 是 的特征值)。这是因为 阶实对称矩阵的所有特征值都是实数,各个特征值的代数重数和几何重数相等(有 个线性无关特征向量),且所有特征向量相互正交(参考此处)。此结论也可理解为 Schur 定理在实数域上的推论 - 可相似对角化 可以
谱分解
:,其中 的列向量是 的(右)特征向量, 的行向量是 的左特征向量(参考此处),( 是 的特征值)。注意性质 3 中的 是正交矩阵,有 ,因此实对称矩阵
利用上述性质 3/4 分析 ,可如下展开(其中 是列向量,尺寸 )
- 正定对称
- 进一步考虑多元高斯分布指数部分的二次型
可见 时, 是 维空间中一个超椭圆。注意到 ,可以看作先把 沿 方向平移,然后向 方向上的投影。不妨在 方向设置坐标轴 ,二维情况()的示意图如下 - 可见随着 值变化, 对应到空间中一系列超椭圆,若把 。进一步考虑整个 n 元高斯分布的概率密度函数 ,前面分数部分是个常数, 则是和 正相关,所以概率密度函数
- 可以如下绘制二维情况下 图像,这里设置期望为 ,协方差矩阵为
2.2 参数数量
- 考察上述 矩阵的参数个数,由于 是对称矩阵,当尺寸为 时,参数有 个,这时所有参数都非零,意味着 元高斯随机变量 中任意两个维度 相关。举例来说,期望为 ,协方差矩阵为 时属于这种情况,此时 ,如下所示
- 希望减少参数数量,可以假设 元高斯随机变量 中任意两个维度 相互独立,这时 除了主对角元素外其他元素都是 ,参数减少到 个。举例来说,期望为 ,协方差矩阵为 时属于这种情况,此时 ,如下所示
- 进一步减少参数数量,可以假设 元高斯随机变量 中任意两个维度 相互独立且各向同性,这时 除了主对角元素外其他元素都是 ,且主对角线元素都为相等正数,参数减少到 个。举例来说,期望为 ,协方差矩阵为 时属于这种情况,此时 ,如下所示
- 可以使用极大似然估计来估计多维高斯分布的参数,请参考:一文看懂 “极大似然估计” 与 “最大后验估计” —— 极大似然估计篇
- 注意到 元正态分布函数的概率密度函数很复杂,要计算
- 普通一元正态分布 的特征函数为(证明见
4.2
节分量独立性证明) - 元正态分布 的特征函数为
详细证明过程如下
4.1 边缘分布
-
“多元正态随机向量” 的每个元素是 “一个正态随机变量”
: -
“多元正态随机向量” 的部分向量仍为 “多元正态随机向量”
:若 ,则其第 分量组成的随机向量满足
其中 是保留 的第 行列所得的 矩阵, 是 的第 分量拼成的向量。从特征函数角度证明如下
4.2 分量独立性
独立性
:若 ,以下陈述等价(注: 随机变量 互不相关
指没有线性关系,即协方差为0;独立
指没有一切关系)- 相互独立
- 两两独立
- 两两互不相关
- 为对角阵(即不同的两个元协方差为0)
- 证明: 显然; 是随机变量性质; 是互不相关定义;只需证明 即得四者等价
4.3 线性变换
-
一组正态分布随机变量的线性组合(多元正态随机向量的线性变换)仍然服从正态分布
- 设有 元随机向量 ,则对 有
这里 其实就是对 中所有正态随机变量 线性组合得到的一元正态随机变量。上式从特征函数角度可证明如下 - 注意,这里 是 n 元正态分布的特征函数;
- 设有 元随机向量 , 为 矩阵,且行向量线性无关,则
其实这里 中的每一行都对应了一个 1 中的线性组合。上式可以用特征函数证明如下 - 注意, 表示的是 元正态分布的特征函数; 表示的是 元正态分布的特征函数( 将 元的 变换为