專欄 | 田淵棟:第一屆FLAIR感想

 2017-12-27 11:57:00.0

原標題:專欄 | 田淵棟:第一屆FLAIR感想

作者:田淵棟

作爲這次東方科技論壇,人工智能海外博士生研討會(Future Leaders of AI Retreat, FLAIR)的組織者之一(感謝上海紐約大學張崢教授牽頭),我覺得這次會議舉辦得很成功。首先學術水平非常高,每個領域做得最好的幾個海外博士生過來演講,工作也是他們親手做的,更可貴的是演講質量,包括原創性、流暢性和組織性,都非常好。我有種感覺是大家都把它當成主題演講(Keynote)來準備了。此外,與觀衆的互動也非常有效率,提問切中要害,討論熱烈而不流於形式,沒有空話套話。從某種程度上說,這比請他們的老闆還要有效。一個會好不好,就看內容是否充實,交流是否充分,這次的會議全都做到了。

這次議程中有三個專場和我有關,理論、強化學習和系統,前者(基於數據分佈的非凸優化)是我博士階段一直做的方向,之後將相似的思路運用於深度學習上,而我們最近的 ELF 訓練平臺則和後兩者密切相關。這次理論環節有很多人聽並且提出高質量的問題,讓我感到非常驚訝。我想這主要是因爲最近在 NIPS 上有關深度學習是否「鍊金術」的爭論吧。雖然整個領域在理論方面有所進展,但仍然侷限於形式比較簡單的非凸問題(如矩陣低秩分解)或者很強的假設(如淺層網絡高斯輸入)。希望在新的 2018 年會有更多深入的理論文章出來,在這方面我也會盡自己的綿薄之力。

關於深度學習的理論,來自卡耐基梅隆大學的杜少雷說等十年二十年,我覺得有點悲觀。其實只要有一兩篇打開局面指導大方向的文章,那大部隊(做數學、統計學、理論計算機等方向的學者)會很快涌入,把整個體系建立起來。現在的問題是這不是好摘的果子,沒人願意碰。我還是堅信目前深度學習沒理論未必意味着真沒理論,回顧歷史,哪一個使用廣泛效果卓著的東西沒被整理成漂亮的形式?行星運動、電磁現象、熱力學、頻譜分析、空氣動力學,沒找到理論前都十分複雜,等到經過千錘百煉簡化了之後,銀妝粉黛進了教科書,大家纔會感嘆一切如此完美精緻。我的想法是,在欣賞理論之美之餘,還是要記得是現實問題塑造了數學工具而不是倒過來,更不能在現有工具暫時無法解決新問題之前輕言放棄。

要是沒路,就要自己開條路出來。

強化學習專場由我主持。每個演講都有出彩的地方,像來自英國劍橋大學的顧世翔用時序差分模型去做任務規劃,來自卡耐基梅隆大學的周佳驥使用預設的物理模型來教機器人完成複雜任務,來自斯坦福大學的朱玉可讓機器人自動拼接子程序,還有北京大學的孔祥宇用主-從關係來控制即時戰略遊戲多兵對戰的戰術指揮。這些都代表着強化學習的最新探索方向。最後,我把我們組的輕量快速靈活的強化學習訓練平臺 ELF 再宣傳了一次。演講完之後的討論涉及到幾個強化學習的根本問題,比如說到底是要用數據訓練(這樣樣本複雜度會比較高)還是加入儘可能多的先驗知識(這樣靈活性會受影響);如何探索巨大的狀態和行動空間,如何處理探索未知和利用現在好的策略之間的關係,等等。

關於(深度)強化學習,我覺得一個目前比較困難的點,是很多算法設計都是人爲加入的,比如說物理模型的選取,比如說程序裏那些函數的設置,比如說層次式強化學習中每一層的設計,這些都是預先給定的,而計算機只是調整裏面的參數,以達到最優的性能。若是要再往上走一層,達到對結構本身的學習和對概念的自動抽取,目前還非常困難;然而若是要達到人的水平,這些能力是必不可少的。目前來看,這樣的研究用進化算法或者隨機搜索是可以做的,只是需要耗費大量的資源,目前只有大公司纔可以辦到。

第一天傍晚是自然語言專場,先是今日頭條的李航博士講解了對話系統的構建,然後是深度好奇創始人呂正東介紹瞭如何在自然語言分析中使用預先定義好的類信息來構建知識圖譜,來自伯克利的胡戎航則介紹了我們組(Facebook AI Research)在 CLEVR 數據集上的基於圖像的問答系統。這裏的一個核心問題是如何結合符號表示和深度學習,如何處理模糊語義,還有如何表示更高級的抽象概念,這些都是很大而且還完全沒有解決的問題。

第二天的系統專場有來自華盛頓大學的陳天奇向大家講解 TVM,一種張量操作的中間層表示方案,整個演講很清晰並且展示了用這種表示方案自動生成代碼後的加速效果,接下來是王敏捷講解上海紐約大學在這方面的努力。很明顯這兩個工作是互補的,我相信在這之後會有進一步的合作。在討論環節,上海紐約大學的張崢教授問大家爲什麼選系統方向?我覺得這是個很好的問題。願意做系統的人,往往都是想要認真解決實際問題的人,而不是隻想着猛發文章了事。是以做系統的學者儘管文章不多,但是做的東西非常紮實可用,也可以推動其他方向的發展,所以我希望將來更多的同學參與到這個領域中來,做可重複且實用的研究(這個對深度強化學習尤其重要)。另外,做系統可以鍛鍊人多方面的能力,使用現有軟件乃至想出想法並不難,但能不能把一個系統調通做好,可以說是進階者和初學者的分界線,也是在職場上極度稀缺的能力。

最後一個專場是討論 AI 的創造性的。主要有來自斯坦福的施正珊講述了一些人和 AI 合作創作音樂的實踐,還有筑波大學的兩位本科生介紹結合衆包和 AI 做時裝設計的系統。之後的討論順理成章地滑向了「AI 本身是否有創造力」及「如何評價 AI 創造的藝術」這個話題,討論非常熱烈,話筒難求。和圍棋這種有絕對標準的遊戲不同,我的意見是對於藝術作品,得是要全人類來做評判,對於人本身的建模非常難,而且評判標準會隨時而變,所以在這方面,AI 會和人類一起前進吧。


文章來源:機器之心