元慶歡迎您, 很高興您今天可以加入我們的討論 當然 今天您是百度 IT 研究院的頭 而當大陸政府 當大陸政府開始找人來 建立國家深度學習研究實驗室 他們找上您來開始從事這些事情 我想我可以說您是 整個中國深度學習的第一把交椅 我想要問您一些工作上的問題 在這之前, 我想先聽一聽您個人的故事 您怎麼會從事這一個行業? 實際上, 在我博士學位以前 我主修光學 是比較偏向物理 我覺得我的背景不錯 我的數學背景不錯 後來到美國 我當時想 我的博士要主修什麼? 我當時想 我猜我可以主修光學或者其他 回到 2000 年 我想奈米科技很熱門 但我想或許我應該學 更令人興奮的學科 這留下了一個好的機會當我在 UPenn 修課的時候 我遇到了 Dan Lee 後來, 他成為我的博士生導師 我想, 機器學習是一件很棒的事情 我非常興奮, 改變了我的主修 所以, 我在 UPenn 攻讀我的博士學位時 主修於機器學習 我在那裡待了五年, 這真的 令人興奮 我從頭學習很多東西, 很多演算法, 像是 PCA 在之前我都不懂 覺得我好像每天 都在學新的東西 對我而言是非常 令人興奮的經驗 這是很多起頭之一 雖然, 您做了很多事 但被低估了它的時間 是的, 我想 NEC 是個令人興奮的地方 我在那兒剛開始是一個研究員 再次, 讓我覺得, 哇 我學到了好多 實際上, 我在 NEC 後來 開始工作於電腦視覺 實際上我很晚才開始做電腦視覺, 比較晚 我第一件事情是 我參加 ImageNet 挑戰, 那是 ImageNet 第一年挑戰 我管理一個團隊做一個專案 很幸運, 我們很幸運我們很強 最後 我們實際上得了第一名 壓倒性的, 在比賽中的第一名 所以您是世界第一個 ImageNet 競賽的第一名 是的, 我就是在那個研討會作展示的人 那是一個很棒的經驗 那真的讓我進入了 很大規模的電腦視覺任務 從那時我便從事於 大規模的電腦視覺工作 當紐約時報標題出現時 (譯注: New York Times: How Many Computers to Identify a Cat? 16,000 ) 跟後來 AlexNet 出現時 真的讓我印象深刻 我想, 哇, 深度學習是如此的強大 從那時候起, 我花了很大的力氣在上面 所以,作為中國國家研究實驗室的負責人 國家研究院在深度學習 應該有很多的 令人興奮的活動在那裡 所以對於全世界的人, 看這段影片的人 他們應該知道 這個研究室在做什麼? 這個國家工程研究室的任務是 建立真的很大型的 深度學習平台 希望成為最大的一個 或者至少是中國最大的一個 這個平台會提供人們 深度學習框架例如 PaddlePaddle 我們提供人們 很大規模的計算資源 我們也提供人們 很龐大的資料 如果人們能夠做研究 或開發好的技術在這些框架上 我們也提供大的應用程式 舉個例子, 一些技術可以應用 在百度的大應用程式上 所以技術水準 可以藉此整合及改進 我們相信整合 這些資源在一起 我想, 這會是 真的很強大的平台 我可以給您一些例子 舉個例子, 現在, 如果發表一篇論文 有人想重現它 最好是這個發表人 在某個地方提供原始程式 您可以下載這些程式到 您的電腦, 而且 您也能夠找到相關的資料集 或許您需要好的架構 來搭配您的計算資源以便跑得很順利 這些都非常花力氣 國家實驗室會讓 事情變得簡單一點 所以如果某人 用這個平台寫這個論文 來做這些工作及寫論文 那實驗室平台上會有 這些程式 而針對這個程式, 計算架構已經設定好 資料集也在 所以基本上,您只需要用 命令行(command line) 來重現結果 所以這對於資訊科技而言 是很大的紓解關於重現的問題 您很簡單,只花幾秒鐘 您可以從論文看到的東西開始學習 所以, 這真的很強大 這只是其中一個例子 我們努力去確定 我們提供很強大的平台 給這個社群跟這個產業 真的太棒了, 真的可以加速深度學習研究 是的.是的. 您可以給一點大概嗎? 有多少資源 中國政府放在這個 深度學習國家實驗室 我想對於這個國家工程實驗室 我想政府投資一些資金 在建設基礎設施 我想更重要的是 這將會是 中國旗艦級的平台 帶領很多深度學習的力量 包括像是國家級專案 跟很多的政策 這真的是很強大 我想對於百度 我們真的很榮幸 來做這個實驗室 在中國, 你是深度學習的中心 所以, 在中國有很多活動 全球觀眾還沒有意識到, 還沒有看到 那麼, 中國以外的人應該如何瞭解 中國的深度學習呢? 是的, 我認爲在中國 特別是最近幾年 我想深度學習強化了一些產品服務 所以真的很繁榮 範圍從搜尋引擎, 到像是語句辨識 監控系統, 到電子商務, 很多地方 我想他們投資了很多 在深度學習上 同時也使用這個科技來 讓他們的生意更強大 我想在發展人工智慧時 這是非常重要的 我想對於我自己 同時很多人也這樣分享 我們相信這是很重要的, 通常稱為正向循環 舉個例子, 當我們開始 想建立一些科技, 會有一些資料 我們會試著一些演算法, 它會 發表一些產品來做這個服務 然後, 從用戶端取得資料 而獲得更多的資料 我們會發展更好的演算法 因為有了更多的資料, 我們知道什麼是好的演算法 有了更多的資料跟 更好的演算法 我們會有更好的科技來做產品服務 當然我們希望會吸引更多的消費者 來使用這個產品 技術更好 然後我們獲得更多資料 所以這是一個很好的正向循環 而這很特別 特別是在人工智慧技術上 相對於傳統科技, 像是雷射 我之前做過 這些技術的成長 比較是線性的 但對於人工智慧科技 因為這種正向循環 您可以想像, 某一種程度以後 會成長相當快速 而這是相當重要的 當我們在設計一個研究 當我們的 R&D 在設計時 我們朝著這個方向前進, 為了很快速來到這個快速改進的階段 但如果整個生意 沒辦法發現這種正向循環 如果我們沒辦法發現 這種強大的正向循環 這不會成功, 因為別人會 有強大的生意來 發現這個強大的正向循環 那他們比你更快來到這個階段 所以這是很重要的邏輯, 當我們看待它的時候 這麼說, 您需要 一家公司, 我們要往哪一個方向, 我們不要走哪一個方向 這絕對是一個非常重要的因素 要去考慮 今天, 無論是在中國, 在美國和全球 有很多人想進入深入學習 和希望進入 AI 領域 對於想進入這個領域的人, 你有什麼建議? 現在, 一定有人從開源框架開始 我認為對大部分入門者 那是很強大的工具 當我開始學習我的深度學習時 並沒有很多開源的資源 時至今日, 在人工智慧, 特別是深度學習 有很棒的社群 有很多很棒的開發框架 像是 Tensor Flow, Caffe 現在稱為 Caffe 2, 是吧? 在中國有很棒的 PaddlePaddle 甚至在很多線上課程 他們告訴您如何使用這些框架 而今, 也有 很多公開的評測, 人們也會看到 很熟練, 很有經驗的人 他們在這些評測上作得多棒 所以, 基本上, 要去熟悉深度學習 我想這是很棒的起始點 您如何獲得這些知識的 事實上, 我用相反的方式做 我先學習 PCA (Principle Component Analysis), 然後學 LDA (Linear Discriminant Analysis) 所有這些 在我學習深度學習之前 基本上, 這也是好的方式 我們打下了很多基礎 我們學習了圖形模型 這些也都很重要 雖然現在, 深度學習已經變為主導 但理解這些,實際上會給您很好的直觀 有關於深度學習如何作用 有一天 也許會連結深度學習到 這些框架或這些途徑 我想已經很多這樣的連結 而這些會讓深度學習 更加豐富 我的意思是, 有很豐富的方式來做深度學習 所以, 我覺得有很多的開源 是好的開始 而這些都是很強大的資源 我也建議您也要學習一些 基本的機器學習的東西 謝謝您, 真的很有意思 即使我認識您很久了 也很多您的想法細節 我直到現在才知道, 很謝謝您 感謝您的邀請