很多团队经常会为在某些识别分类的任务上 获得了超出人类水平的性能而兴奋不已 我们接下来要讨论的是  当你想要达到这样的性能目标时 将会遇到的情况 我们之前已经讨论过 当性能接近 或超过人类水平时 机器学习的进展将会越来越慢 我们通过一个例子来看看为什么会这样 假设你有一个问题 由人类团队通过深入讨论和辩论 可以达到0.5%的误差 单个人类的误差为1% 你的算法的训练集误差为0.6% 开发集误差为0.8% 在这种情况下 可避免的偏差有多少呢 这个问题比较容易回答 对贝叶斯误差的估计是0.5% 那么计算可避的免偏差时 你不会使用这个1%的值当作参考 而是这两个值的差 由此 你可以估计可避免偏差至少是0.1% 方差为0.2% 所以 减少方差可能比减少偏差有更大的提升空间 现在来看一个难度大些的例子 假设人类团队和单个人类的表现和上例一样 而你的算法在训练集上的误差为0.3% 在开发集上的误差为0.4% 现在可避免偏差是多少呢 这个问题就比较难回答了 实际上 你的训练误差为0.3% 是不是意味着有0.2%的过拟合? 还是说贝叶斯误差实际上是0.1% 或者贝叶斯误差是0.2% 或者贝叶斯误差是0.3% 你并不知道 基于这个例子给出的信息 实际上你并没有足够的信息 来判断应该专注于减少算法的偏差还是方差 所以 你取得进展的效率就降低了 此外 如果你的误差已经比 人类团队通过讨论和辩论才能达到的误差还小 那么你就更难以依靠人类的直觉 来判断还能从哪些方面来优化 算法的性能了 在这个例子里 一旦超过了这个0.5%的阈值 对这个机器学习问题进行优化的 方法和方向就变得不明确了 这并不意味着你无法取得任何进展 你仍然可能取得重大进展 只是用于指明方向的 工具不那么好用了 现在 机器学习在很多问题上 已经取得了大大超过人类水平的性能 例如 我认为 对于在线广告 估计用户点击某个广告的概率 学习算法的性能可能已经远超任何人类了 还有产品推荐 为用户推荐电影或者书什么的 我认为当今的网站可以做得 比你最亲密的朋友还要好 或者物流 预测你从A地到B地开车需要的时间 或者预测快递车辆从A地到B地需要的时间 或预测某人是否会还贷 据此判断是否应该批准贷款申请 我认为对于以上这些问题 如今机器学习的表现都已经大大超过了人类 值得注意的是 以上四个例子 都是从结构化的数据中进行学习 比如有用户点击过的广告的数据库 你所购商品的数据库 从A地到B地所花时间的数据库 以前的贷款申请及结果的数据库 这些都不是自然感知(Natural Perception)问题 不是计算机视觉 或者语音识别 或自然语言处理的任务 人类非常擅长自然感知的任务 这使得计算机 在自然感知领域超过人类水平 虽然是可能的 但是难度更大一点 最后 在上述所有问题中 团队都要能获取到海量的数据 例如 上述四种应用中 最好的系统 看过的数据可能比任何一个人类所能看的都多 这使得它相对容易取得 超过人类水平的性能 事实上 由于计算机可以检索海量的数据 所以它比人类更擅长挖掘数据中的统计规律 除了这些问题 现在也有一些语音识别系统的性能超过了人类水平 在一些计算机视觉 和一些图像识别任务上 计算机也超过了人类水平 但是因为人类很擅长于这些自然感知任务 我认为计算机要达到这种水平要更难一些 还有一些医学相关的任务 例如 阅读心电图或诊断皮肤癌 或者一些特定的窄波放射科的任务 现在计算机已经很擅长这种任务了 甚至可能已经超过了单个人类的水平 我认为 在深度学习的最近进展中 一件令人兴奋的事就是 甚至在自然感知领域 在某些情况下 我们也能取得超过人类水平的性能 不过这会更难 因为人类很擅长这种自然感知的任务 所以 取得超过人类水平的性能通常都不容易 但是基于足量的数据 已经有很多深度学习系统 在单个监督学习问题上 已经超过了人类的水平 这也适用于你所开发的应用 希望有一天 你的深度学习系统 也能取得超过人类水平的性能