北京大學王立威教授:高校算法的突破與創新要走在數據前面

 2017-03-07 10:32:00.0

雷鋒網AI科技評論按:中國人工智能學會AIDL第二期【人工智能前沿講習班】日前在北京中科院自動化所舉行,本期講習班的主題爲【機器學習前沿】。北京大學教授王立威帶來了題爲《機器學習理論:回顧與展望》的主題報告,主要對機器學習中關於泛化能力的幾個重要理論進行介紹。

北京大學教授王立威博士的主要研究領域集中於機器學習,在包括COLT, NIPS,JMLR, PAMI等權威會議期刊發表論文60餘篇。2010年入選AI’s 10 to Watch,是首位獲得該獎項的亞洲學者。2012年獲得首屆國家自然科學基金優秀青年基金,新世紀優秀人才。任NIPS等權威會議Area Chair,和多家學術期刊編委。在主題報告結束後,雷鋒網(公衆號:雷鋒網)AI科技評論與王教授做了短時間交流。

北京大學王立威教授:高校算法的突破與創新要走在數據前面

1. 您曾經指出,機器學習理論在於理解人工智能的侷限性。結合您的研究經歷,您認爲人工智能現在能做什麼?還不能做什麼?可能的突破口又在哪裏?

我覺得在過去幾年,人工智能或者機器學習的發展已經把這個問題很好地展現了。現在做得很好的兩個領域主要集中於圖像和語音,由於深度神經網絡的結構利用了先驗知識,自然也非常適用於這兩個領域。

當然,產業現在也發展得比較好,所以我認爲未來短期內如果會有重大突破的話,更多的是在應用領域,找到和圖像和語音相關的比較好的結合點,可能不是偏學術領域,而會是一個是偏商業化的方向。(AI科技評論:更好地產品化。)對,找到一個更好的應用。

2. 目前工業界開始出現與高校合作的趨勢,前者提供數據和研發資金,後者提供研發支持,而往往這些研究都是應用導向的。您認爲這樣的合作會對理論研究產生怎樣的影響?

我想舉這麼一個例子,就是產生很大影響的 AlphaGo。從最終展示出來的成果來看,我們可以認爲,AlphaGo 是一個非常成熟的應用系統。而 Alpha Go 從最開始的想法到技術落地,同樣很大地推動了學術的前進。比如 DeepMind,不論是從算法和理論上都有突破,這一點研究界也有目共睹。(工業界研究推動學術發展)同樣也是很好的一個模式,我認爲,將來工業界和高校的合作趨勢也可以取得這樣的一個成功。

3.現在雲計算已經將計算力提升到一個以前不敢想象的高度,甚至已經遠遠高於樣本的獲取能力。那麼構建樣本會成爲未來的研究重點嗎?

數據其實是一個很大的問題,也牽扯到很多方面。我的一個考慮是,今天應用的比較成功的領域,包括圖像和語音方面,實際上這些是屬於非專業知識的數據,隨便請一個人,一個普通人,就可以對圖像或者語音進行標註。這類問題當然也有應用,但有很多相當一大類數據是屬於專業數據,比如說醫療數據,這些只能讓醫生進行標註,它的成本實際上是很高的。

4.  此前與其它老師交流的時候,他們提及高校研究的數據量不夠大的問題。那麼從您個人的研究經驗來看,數據對於算法而言處於怎樣的地位?

我認爲主要有兩個方面。一種是應用,關注的是系統的最終性能,而數據對後者的影響是巨大的。當然高校是完全無法和企業相提並論的。但高校更重要的一個任務是,我能不能去設計新的更好的算法。我們並不是只停留在 Deep Learning 這樣的算法上,就像我在演講中提到的那樣,也許兩三年後,Deep Learning 也許就不是最好的,這完全有可能。那麼這個新的算法該由誰來提供?我想這應該是高校教師的職責,是他的本職工作,researcher 就應該做這樣的事情。所以我提出一個新的算法,未必要等到手裏有巨大的數據量纔開始做研究。

關於王教授及其他教授的主題報告,敬請期待雷鋒網的後續報道。

圖 via wcva

北京大學王立威教授:高校算法的突破與創新要走在數據前面

文章來源:雷鋒網