目录

  • 1 引言
  • 2 什么是正态分布
  • 2 正态分布的叠加性
  • 3 正态分布的标准化
  • 4 参考文献


1 引言

  正态分布又称为高斯分布,它在机器学习和深度学习中非常常用。如正态分布的叠加性和正态分布的标准化等,在VAE模型中重参技巧就用到了正态分布知识,特别是在高维数据中高维的正态分布更是常用。因此,准备梳理一下相应的知识,其中内容多有参考其他博客,一并在参考文献中给出链接。

2 什么是正态分布

做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python服从一个数学期望(均值)为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_02、方差为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_03的正态分布,记为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_04。其概率密度函数为正态分布的期望值做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_02决定了其位置,其标准差做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_正态分布_06决定了分布的幅度。当做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_正态分布_07, 做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_参考文献_08时的正态分布是标准正态分布。
一维正态分布的概率密度函数为:
做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_09
高维正态分布后面再补坑…

2 正态分布的叠加性

  理论:相互独立的正态分布的线性组合仍然服从正态分布。

给定两个独立的正态分布做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_10做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_11,且做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_12 做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_13均为实数


做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_14

做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率密度函数_15

3 正态分布的标准化

做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_参考文献_16做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_17确定的。对于任意一个服从做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_参考文献_18 分布的随机变量做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python,经过下面的变换以后都可以转化为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_20做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_正态分布_21的标准正态分布。转换公式为:
做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_22
举个例子:
假设公共汽车门的高度按成年男性碰头机会小于做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_23%来设计。又假设成年男性的身高服从正态分布做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_参考文献_24,求问车门的高度做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_25为多少?

假设身高这一随机变量为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python,那么要求的问题为:
做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_27

做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_28

做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_python_29

因为做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_参考文献_24, 所以 做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率论_31

通过查标准正态分布表可知,做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率密度函数_32
因此 做标准正态分布处理后的数据分布范围是Python 正态分布变量标准化_概率密度函数_33

4 参考文献

[1]均匀分布叠加与正态分布叠加

[2]正态分布,正态分布如何变换为标准正态分布

[3]普通正态分布如何转换到标准正态分布

[4]PRML笔记 第二章 (多维)高斯分布