一维高斯分布
一维高斯分布的高斯分布相信大家都见过,公式是这样的:
峰值处是的坐标为,是数据的均值.是数据的方差,方差越小,分布越集中,方差越大,分布越分散.
多维高斯分布
一维高斯分布只反映了一个变量的分布情况,多维高斯分布可以反映多个变量的分布情况.维基百科给出的多元高斯分布定义是这样的:
我们可以变一下形:
我们来把多维高斯分布的公式与一维高斯分布对比一下发现,在有两点不同:
第一点不同,多维高斯分布把替换为.其实可以写成,如果数据只有一维的话,那就只剩这一项,也就与一维高斯分布对应起来了.
第二点不同,多维高斯分布把把方差换为,到了高维之后,不仅有各维自己的方差,还有两两之间的协方差,协方差反应两个变量的相关程度,这些方差和协方差放到一个矩阵中就是协方差矩阵.
我们拿二维高斯分布举个例子,二维协方差矩阵是这个样子的:
从上图可以看出方差反应各纬度数据的分布情况,而协方差协方差反应两个变量的相关程度.我们还可以列举几个不同协方差的二维二维高斯分布:
协方差矩阵
一个维度,我们根据数据计算均值与方差:
均值:
方差:
两个维度,我们可以计算两个维度的相关程度,即协方差:
协方差:
n个维度,协方差矩阵会是一个的正定矩阵:
这里的X_1等表示某一维度的所有数据.
我们发现协方差矩阵是对称的,另外协方差矩阵是半正定矩阵.
协方差矩阵的计算
我们处理数据集的时候通常拿到的是一个包含m个数据的数据集合:
其中每一个数据都有n个特征:
这时我们该如何计算协方差矩阵呢?
X可以写成由很多维的数据组成的:
这样的话协方差矩阵为:
这里的为各维度均值组成的向量.
数学推导
首先一维标准正态分布你懂吧?
二维标准正态分布,就是两个独立的一维标准正态分布随机变量的联合分布:
把两个随机变量组合成一个随机向量:
则有
然后从标准正态分布推广到一般正态分布,办法是通过一个线性变换:
注意前面的系数多了一个(A的行列式)。
可以证明这个分布的均值为,协方差为。记,那就有
高维情形同理。
参考:
https://zh.wikipedia.org/wiki/%E5%8D%8F%E6%96%B9%E5%B7%AE
https://zh.wikipedia.org/wiki/%E5%8D%8F%E6%96%B9%E5%B7%AE%E7%9F%A9%E9%98%B5
https://www.coursera.org/learn/machine-learning
https://www.zhihu.com/question/36339816