如果你在研究一个
全新的机器学习的应用我常给人们提的一个建议是你应该迅速构建你的第一个系统
然后进行迭代让我来解释这是什么意思
我研究语音识别很多年了假设你正在考虑建立一个
全新的语音识别系统实际上有很多方向你可以做很多事情你可以区分优先级比如有很多技术可以让语音识别系统对背景噪音更加稳健背景噪音可能是咖啡馆的噪音比如很多人在背景里讲话
或者是汽车噪音汽车的声音高速公路的声音
或者其他类型的噪音有很多方法让语音识别系统
对方言更加稳健有些问题与演讲者离麦克风太远有关这被称为远场语音识别 (识别)孩子的声音有特殊的挑战不仅因为他们对单词的发音也因为他们对单词的选择
和他们常用的词库如果有些时候演讲者结巴或者他们
用一些无意义的语言比如哦啊嗯有很多不同的选择以及不同的技术来输出语音文本使得阅读更加流畅因此有这些以及很多其他的事情你可以做
来改善语音识别系统更普遍地来说
对于几乎所有的机器学习应用可能有50个不同的方向去研究每个方向都是合理的
会使你的系统更好但挑战是如何从中选择需要关注的问题即使我从事语音识别研究很多年了如果我要为一个全新的领域
建立一个新的系统我还是会觉得
如果不花费时间去思考这些问题选择可能会有些困难所以我们的建议是如果要构建一个全新的机器学习应用你要迅速构建第一个系统然后迭代我的意思是我建议你快速建立一个开发/测试集
以及度量指标这就决定了你的目标在哪儿如果你发现出错了
你始终可以稍后移动目标但是至少在某处设立一个目标然后我建议你快速建立一个
初步的简单的机器学习系统找到训练集训练它
然后看(结果) 开始观察并理解你的系统对开发/训练集如何
价值和度量指标是多少当你构建了初步的系统你就可以用偏差/方差分析
这些我们之前谈论过还有错误分析在前几个视频里去区分下几步工作的优先级具体来说如果错误分析让你意识到很多错误是由演讲者离麦克风太远导致的这是语音识别的挑战那么这就给了你一个很好的理由去研究远场语音识别技术意思是处理当演讲者
离麦克风很远时的问题建立这个初始系统的价值是作为一个迅速并且早期的实践不要考虑太多然而这些初始系统的价值在于
有一些学习的系统有一些训练过的系统
使得你能定位偏差/反差去区分下一步做什么去做误差分析去研究一些错误去找到不同的研究方向这些价值才是真的值得的回顾一下我的建议是
快速构建你的第一个系统然后迭代这个建议不那么适用
如果你处于一个你经验丰富的领域这个建议同样也不适用于当有很多可以参考的学术论文针对你正在研究的
几乎完全相同的问题比如说有很多学术文献研究人脸识别如果你正在尝试建立人脸识别系统你可以从一开始就打造一个复杂的系统依托于大量的学术文献但是如果第一次
你正在研究一个新的问题那么我建议你真的不要考虑太多
也不要把你的第一个系统做得太复杂只要建立一个快速的早期的系统
然后使用它来帮助你确定一个优先级
如何来改善你的系统我见过很多机器学习的项目我也见过很多团队考虑得太多
建立很复杂的东西我也见过一些团队考虑得太少
然后建立可能太简单的东西但总得来说我见过多得多的团队考虑得太多构建太复杂的东西相比于那些构建过于简单的团队我希望这(对你们)有帮助如果你正在将机器学习算法
投入到一个新的应用如果你的主要目标是构建可用的东西而不是去发明一个新的机器学习算法这是不同的目标那么你的主要目标是
建造运行得很好的东西我会建议你建造迅速的早期的东西用它来进行偏差/反差分析用它来做误差分析用这些分析的结果
去帮助你辨别接下来做什么