如果您正在建立一個 全新的機器學習應用 我經常給人們的一個建議是 我想您應該要很快建立您的第一個系統, 然後做循環 我來解釋一下, 我已經從事語音辨識很多年 而如果您想建立一個新的語音辨識系統 實際上有很多的方向可以走 很多個事情要分優先次序 舉個例子,有特定的技巧來 讓語音辨識系統 專精於對於背景噪音的處理 而背景噪音可能是 咖啡機噪音 或者很多人在背景談話,或者汽車噪音 來自於高速公路的汽車 或者其他的噪音 有很多方法來讓語音辨識 識別鏗鏘有力的演講 有一些特定的問題, 像是講者遠離麥克風 這是稱為遠距語音辨識 小朋友的語音辨識 有特殊的挑戰 一方面是他們如何發個別字的音, 還有他們選擇使用的詞彙 如果有時候講的人結巴, 或者使用無意義的短語像是喔,啊 嗯,有不同的選擇跟 不同的技巧來輸出您的文本 而且還是可以很流利 所以有這些跟 其他許多事情您可以做 來改進語音辨識系統 一般而言,幾乎任何一種機器學習應用 可能有 50 種不同的方向您可以進行 而每一種方向都可以 合理地讓您的系統更好 但問題是 您如何選擇於專注哪一種方向 即使我已經從事語音辨識很多年 如果我要建立一個新的系統 在新的應用領域上 我還是發現有一點困難 來做選擇 而不去花時間來想這個問題 我們的建議如下 如果您開始建立一個全新的機器學習應用 也就是先很快建立第一個系統,然後做循環 我的意思是我建議 您先很快設定 開發/測試集跟量測標準 所以這真的是將您的目標放在哪裡 而如果您弄錯了,您可以以後再換 但先設定一個目標 然後我建議您先很快 建立一個初始的機器學習系統 找到訓練集,然後訓練它 開始看一看跟理解您 針對您在開發及測試集做得如何 跟您的衡量標準 當您建立您的初始系統 您可以使用我們之前談過的 偏差跟變異分析 還有就在不久之前影片中談過的誤差分析 來決定您的下一步 特別是如果誤差分析 讓您意識到很多的錯誤是 從講者離麥克風很遠 導致在語音辨識中特殊的挑戰 那這會給您一個好的理由專注於 解決這個問題的技巧,稱為 遠距語音辨識 基本上的意思是 處理當講者遠離麥克風 建立這樣的初始系統是很具價值的 它可以是很粗糙的建置 不要想太多 但初始系統的價值在於 一些學習系統 用一些訓練系統可以讓您分析偏差跟變異 試著決定下一步 讓您可以做誤差分析 看看一些錯誤 來發現在您可以進行的 所有不同的方向中 哪一種才是最值得的 總結一下,我建議您很快速建立您第一個系統,然後循環 這個建議比較不適合在 如果您做的 應用領域您已經有相當的經驗 也意味著比較不適用於 如果已經有 學術論文您可以參考對於 跟您要建立的的系統相當 舉個例子,已經有很多的文獻談論人臉辨識 如果您想建立一個人臉辨識 或許一開始便可以 直接建立一個複雜的系統 建立在這些學術文獻基礎上 但如果您處理的是第一次新的問題 我會鼓勵您真的 不要想太多或者 不要讓您第一個系統太複雜 只要先建立一個粗糙的然後用它來 幫助您決定如何改進系統 我看過很多的機器學習專案 我也看過很多團隊想太多, 建立太過於複雜的東西 我也看過一些團隊想太少, 建立的東西太簡單 但平均而言,我看到比較多 團隊想太多,建立太過複雜的東西 比起團隊想太少,建立太簡單的東西 所以我希望這會幫到您 如果您應用您的機器學習演算法 到新的應用上 而如果您的目標是 建立一個可以用的系統 而不是您的目標在於發明 一個新的機器學習演算法,這兩者不同 您的目標是讓您的系統 可以用得很好的話 我鼓勵您先建立一個粗糙的系統 用它來做偏差跟變異分析 用它來做誤差分析 用這些分析來幫助您決定 下一步的優先順序