[背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community 第一个让神经元网络方法大显身手的领域 是在计算机视觉 这里需要分析图像和视频 几个例子可以帮助我们知道深度学习或者 大型神经元网络分析是如何被应用到计算机视觉中的 要了解这个我们必须知道图像特征这个概念 在计算机视觉里 图像特征相当于局部的探测器 这些探测器综合起来就能做出预测也就是图像识别 看看这种图片 假设我要预测这种图片是否是一张人脸 我需要用到各种神经元探测器来识别这个图像 比如鼻子探测器 眼睛探测器 另外一个眼睛探测器 一个嘴巴探测器 如果所有的探测器都探测到了对应的东西 你就可以做到 用这么一个小型的神经元网络说这是一张人脸 这是我们的预测 这是一个如何建立一个图像识别器的一个简单的例子 但是 在实际中是没有明显的鼻子或者眼睛探测器 我们所有的就是这些被称为图像特征的东西或者说 感兴趣的点 这些点有许多不同的称谓 需要找到图像的局部单元 和片段 这些局部片段有非常显著的特征 或许你会发现眼角 或许你会发现鼻子周边的角落 如果你有很多这种角落探测器 一张人脸就有这些角落组成 角落探测器会检测到眼角 嘴角 和两只眼睛 如果你能检测到足够多的角按一定规律排列 你会发现这是一张人脸 这个就是所谓的计算机视觉 这就是图像识别的原理 当然了 还有远比这个抽象和复杂的例子 但是 这个例子告诉我们最基本的原理 在很长一段时间里这些描述局部特征的探测器是手工完成的 sift特征就是一个非常流行的 这个东东改变了计算机视觉的面貌因为它们非常 实用 非常酷 在这个基础上还有许多其他的方法来提高精度 这样其他的特征也被用到 我们谈到人工的图像特征sift特征 下面谈谈这些特征是如何被应用到图像识别中的 我们需要做的是在图像中运行sift架构 这些特征会在图像里各点开花 比如眼角和嘴角 然后我们造一个向量来描述这个图像 其依据是sift特征开花的地方 你可能会看到这些特征在有些地方开花有些地方不开花 这个跟寻找一篇文档里的单词很类似 单词messy有没有出现? 单词football(橄榄球)有没有出现? 类似地 我们这里考虑在图像特点的地方有没有发现特征的角 有了这些信息我们就可以把这些信息输入一个识别器 举例来说, 这个学期早些时候我们学的一个简单的线性识别分类器 抱歉不是这个学期 我们这是一个网络课程 这个课程的早些时候 我们在早些时候谈到 你可以把这些信息输入到一个简单的线性识别分类器里 比如 语言回归 支持向量机 或者其他 这些识别分类器会告诉我们这是否是一张人脸 这听起来非常地激动人心 这个对计算机视觉的意义非常重大 挑战在于构造这些人工的图像特征 是一个非常复杂的过程 需要好几篇博士论文 而神经元网络方法可以自动去发现和识别这些特征 举个例子 比如他们给你这么一个图像作为输入 输入到一个三层的神经元网络 你会发现和识别这些局部特征探测器 就好像sift一样 神经元网络的每一层都会发现这些特征 每一个特征探测器探测不同的东西 在不同的层次探测不同的图像性质 在第一层你可能会有可以看到kinda的探测器 想这些局部的片段 会探测到对角线结构 所以第一个探测器的作用就是找到对角线边缘 中间的这个是从另外一个方向抓取对角线边缘 最后一个探测器是抓取过渡特征以及从深色到绿色的变化 再看下面这一层 你就把这些对角线边缘综合起来 形成更复杂的探测器 比如我们在这层发现了这个弯弯曲曲的线 还有特征探测器 你同样发现这种探测器对应于角 探测图像中的角 在最后一层里你的探测器更加复杂 针对各种不同的图像 你最后 就能造出能识别诸如躯干和脸部的探测器 如果你有更多的数据 可能还能识别珊瑚 所以神经元网络在不同的层里 抓取图像的特征 能做到自动学习 [背景音乐] 翻译: RyukaSuu |审阅: 19waa Coursera Global Translator Community