如果你在研究一个
全新的机器学习的应用 我常给人们提的一个建议是 你应该迅速构建你的第一个系统
然后进行迭代 让我来解释这是什么意思
我研究语音识别很多年了 假设你正在考虑建立一个
全新的语音识别系统 实际上有很多方向你可以做 很多事情你可以区分优先级 比如 有很多技术可以让 语音识别系统对背景噪音更加稳健 背景噪音可能是咖啡馆的噪音 比如很多人在背景里讲话
或者是汽车噪音 汽车的声音 高速公路的声音
或者其他类型的噪音 有很多方法让语音识别系统
对方言更加稳健 有些问题与演讲者离麦克风太远有关 这被称为远场语音识别 (识别)孩子的声音有特殊的挑战 不仅因为他们对单词的发音 也因为他们对单词的选择
和他们常用的词库 如果有些时候演讲者结巴 或者他们
用一些无意义的语言 比如哦 啊 嗯 有很多不同的选择 以及不同的技术 来输出语音文本 使得阅读更加流畅 因此 有这些以及 很多其他的事情你可以做
来改善语音识别系统 更普遍地来说
对于几乎所有的机器学习应用 可能有50个不同的方向去研究 每个方向都是合理的
会使你的系统更好 但挑战是 如何从中选择需要关注的问题 即使我从事语音识别研究很多年了 如果我要为一个全新的领域
建立一个新的系统 我还是会觉得
如果不花费时间去思考这些问题 选择可能会有些困难 所以 我们的建议是 如果要构建一个全新的机器学习应用 你要迅速构建第一个系统 然后迭代 我的意思是 我建议 你快速建立一个开发/测试集
以及度量指标 这就决定了你的目标在哪儿 如果你发现出错了
你始终可以稍后移动目标 但是 至少在某处设立一个目标 然后 我建议你快速建立一个
初步的 简单的机器学习系统 找到训练集 训练它
然后看(结果) 开始观察并理解你的系统 对开发/训练集如何
价值和度量指标是多少 当你构建了初步的系统 你就可以用偏差/方差分析
这些我们之前谈论过 还有错误分析 在前几个视频里 去区分下几步工作的优先级 具体来说 如果错误分析 让你意识到 很多错误是 由演讲者离麦克风太远导致的 这是语音识别的挑战 那么 这就给了你一个很好的理由 去研究远场语音识别技术 意思是 处理当演讲者
离麦克风很远时的问题 建立这个初始系统的价值 是作为一个迅速并且早期的实践 不要考虑太多 然而 这些初始系统的价值在于
有一些学习的系统 有一些训练过的系统
使得你能定位偏差/反差 去区分下一步做什么 去做误差分析 去研究一些错误 去找到不同的研究方向 这些价值 才是真的值得的 回顾一下 我的建议是
快速构建你的第一个系统 然后迭代 这个建议不那么适用
如果你处于一个 你经验丰富的领域 这个建议同样也不适用于 当有很多可以参考的学术论文 针对你正在研究的
几乎完全相同的问题 比如说 有很多学术文献研究人脸识别 如果你正在尝试建立人脸识别系统 你可以从一开始就打造一个复杂的系统 依托于大量的学术文献 但是 如果第一次
你正在研究一个新的问题 那么我建议你 真的不要考虑太多
也不要把你的第一个系统做得太复杂 只要建立一个快速的早期的系统
然后使用它 来帮助你确定一个优先级
如何来改善你的系统 我见过很多机器学习的项目 我也见过很多团队考虑得太多
建立很复杂的东西 我也见过一些团队考虑得太少
然后建立可能太简单的东西 但总得来说 我见过多得多的团队 考虑得太多 构建太复杂的东西 相比于那些构建过于简单的团队 我希望这(对你们)有帮助 如果你正在将机器学习算法
投入到一个新的应用 如果你的主要目标是构建可用的东西 而不是去发明一个 新的机器学习算法 这是不同的目标 那么你的主要目标是
建造运行得很好的东西 我会建议你建造迅速的早期的东西 用它来进行偏差/反差分析 用它来做误差分析 用这些分析的结果
去帮助你辨别接下来做什么