[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 当我们为两个随机变量指定 一个高斯分布的时候 我们为每一对随机变量赋予概率密度值 随机变量的取值是 在其值域范围内的任意值 像1维高斯分布一样 在2维高斯分布的 分布图也只有一个"驼峰" 比如 这个地方就是 概率值最高的地方 所以这里就是蓝色随机变量和 绿色随机变量所对应的最高概率值 所以这些图片的蓝色分量和绿色 分量值的取值范围 就在这个区间内 不管怎样 如果做顶点到平面的垂线 看垂足点的蓝色分量值 和绿色分量值 这两个值就代表了 高斯分布的均值 因为在高斯分布里均值和众数相同 众数即是密度函数极值处的数据点的取值 当取值点逐渐远离众数时 那么取值点对应的 概率值就会逐渐变小 2维高斯分布的另外一种图示方法 也是最常被用到的方法 因为 可以在2维平面里绘制它 这个图叫做"等值图" 等值图就是 3D网格图的"鸟瞰图" 你有一个三维网格图 你从图的顶部往下看 你就可以画出这些等值曲线 就是这些具有相同概率值的椭圆曲线 椭圆曲线的颜色代表概率密度 就是它有多高的概率值 同样这个中心部分 就是具有最高概率值得区域 外围蓝色的椭圆附近对应低概率的取值 就像网格图一样 所以最外面这一圈就是具有较低概率的数据点 当取值逐渐远离中心点 比如从那个方向 当取值逐渐远离中心点 比如从那个方向 再或者这个中间的方向 所有的远离中心的方向 区别只在于概率值下降的速度 在这个最短的方向上 概率值下降最快 在这个最长的方向上 下降速度最慢 还有一些方向下降速度居中 下降速度在上述两个方向上的下降速度之间 好的 这个这个等值图就将是 二维高斯分布的标准 表示方法 二维高斯分布完全由均值矢量和 协方差矩阵确定 这个均值矢量里的均值就是 二维高斯分布在 每一维度上的中心值 在这个例子里, mu1就是高斯分布 沿蓝色轴的中心 对应蓝色分量值 mu2局势这个概率分布 沿绿色轴的中心 两轴的十字交点确定了 这个基于蓝色和绿色分量值空间的 概率分布的中心 协方差矩阵 确定了高斯分布的扩展范围 扩展方向 协方差矩阵的主对角线上的值 就是这个二维高斯分布 在每个维度上的方差 矩阵左上角的这个值 Sigma_blue^2 就是在蓝色方向上的方差 或者说 是被观测向量在蓝色维度上的方差 同样 Sigma_green^2 就是在绿色维度上的方差 但同时 我们还有其他的参数 Sigma_蓝绿 还有 Sigma_绿蓝 事实上这两个值相等 因为协方差矩阵是对称的 这个细节你并不需要了解 非主对角线上的元素 确定了高斯分布的各维度之间的 关联系数 也就是决定了这些个椭圆的倾斜方向 我们来看几个关于 协方差结构的 例子 第一个例子 协方差矩阵是对角矩阵 而且主对角线上的元素值相等 首先 对于一个给定的对角协方差矩阵 我们可以发现各维度之间 没有关联 因为 非主对角元素都为零 这就意味着 如果 其中一个随机变量的值 高或者低 比如蓝色分量值的高低 不会关系到 其他随机变量值得高低 比如绿色分量值的高低 此外 由于主对角线的 元素都相同 我们得到一个圆形的高斯分布等值图 因为 这个高斯分布在两个维度上的 扩展范围完全相同 相反 如果我们在主对角线上 有不同的值 这就意味着高斯分布的扩展范围 在不同维度上是不同的 那样的话 我们就得到 坐标轴对齐的椭圆 最后 如果我们考虑一个完整的 包含关联参数的协方差矩阵 我们可以得到这样倾斜着的 非坐标轴对齐的椭圆 在右边这个例子里 如果蓝色值高 那么绿色值有很大的可能性也高 这两个变量就被称作 正相关随机变量 如果蓝色值低 绿色值有很大可能性也低 好的 我们可以在任意多维度上 定义高斯分布 不仅是一维或二维 这个情况下 我们的均值向量 的元素的个数 多维高斯分布的维度相同 也就是这个表达式里 随机向量x的维度 关于这个协方差矩阵的维度 假定我们有一个d维的随机向量x 那么它对应的协方差矩阵 就是一个d行d列的矩阵 这个矩阵在主对角线上 有d个方差参数 那些非主对角线上的元素 会反应出d个随机变量之间的 关联结构 这样一个矩阵有时会 被叫做半正定矩阵 如果你不知道这是什么意思 也没关系 我只是说出这个名词 作为一个警告 就是 这个协方差矩阵的元素的值 是由一定限制的 多维高斯分布的符号表示 和一维高斯分布的表示方法 非常相似 先一个N x 然后 竖线 然后不同的是后面是mu和大写simga 而不像一维分布那样 只有一个方差项 小写sigma的平方 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community