深度学习非常振奋人心 因为它能从图片中学习一些非常复杂的特征 正如我们之前讨论的 它已经深入影响了近年的 很多关于计算机视觉的应用 我们先来看一些早期的例子 在这个幻灯片的顶部 你能看到一个例子 这个例子试图用神经网络识别交通信号 这些是德国的交通信号数据 我们要做的是识别出每张图片中的交通信号 使用深度神经网络 它能达到99.5%的准确率 非常酷 在底部你能看到一个Google的例子 它试图利用街景数据识别出门牌号 这些数据是Google使用四处行驶的汽车并 通过照相的方式记录下世界各地的街道产生的 你能看到这些图片非常复杂 但是它们仍然能获得针对单个字符的97.8%识别率 这都是一些非常振奋人心的结果 但并不能说它们改变了这个领域的一切 真正令人兴奋的事件发生在2012年 多年以来 存在着一个非常著名的比赛ImageNet 在2012年 Imagenet比赛收集了120万图片数据 涵盖1,000个不同的类别 焦点是能否对这些图片进行分类 不是简单的问是否是一条狗 而是要区分金毛和拉布拉多犬 分类的类别非常详细 然后有许多团队在一起比赛 这些是前三名 一个叫OXFORD_VGG的团队的准确率非常高 如果只考虑分类结果中的最有可能的前五个 是否包含最终的正确结果 他们的错误率只有25% ISI的结果要好一点点 这个使用了传统的一些技术比如SIFT[1] 并采用了精心的设计 而这个叫SuperVision的团队 使用了一个深度神经网络 性能大大的超过了他们的对手 他们的结果大大的提高了大家对在计算机视觉中 使用深度神经网络的兴趣 因为他们只需要使用一些手工指定的特征 然后就能自动学习这些特征 现在那个SuperVision团队用来赢得比赛的神经网络 叫做AlexNet神经网络 这里有一张来自他们论文的图片 你们能看到这个神经网络包含8层 6,000万个参数 这种方法之所以可行要归功于新的训练算法 这种新的训练算法能处理海量的图片和参数 和能真正扩展到海量数据的基于GPU的算法实现 [背景音乐] 翻译: xuq | 审阅: PhoenixLIU Coursera Global Translator Community