人工智能的主流之路：20年機器學習

2016-08-10 16:31:00.0

聯合編譯：章敏，高斐

當我在1995參加了計算機科學的時候，數據科學並不存在，但我們仍然在使用許多早已存在的算法。這不僅僅是因爲神經網絡的迴歸，也可能是從那時起，就已經沒有發生太多根本性的變化。至少給我的感覺是這樣的。有趣的是，從今年開始，人工智能似乎終於已經成爲主流。

在雲計算機，智能手機，或聊天機器人出現之前，1995年聽起來像是非常痛苦的時期。但在瞭解過去的幾年時，如果你未身處其境，感覺起來就像是很久以前的事一樣。就如自我延續一樣，它將一切都貼在一起，雖然已經改變很多，但與現在相比，世界沒有感覺到根本不同的。

堅持不懈從事計算機科學

計算機科學從未像現在一樣未接近主流。後來，隨着2000年左右的第一個網絡泡沫。有些人甚至質疑我學習計算機科學的選擇，因爲編程計算機很顯然變得非常容易，再也不需要專家了。

事實上，人工智能是我學習電腦科學的主要原因之一。將它作爲一種建設性的方法來理解人類思想的想法，對我來說非常耐人尋味。前兩年我都在訓練，以確保自己有足夠的數學水平來解決道路上的阻礙，且最終上了第一堂AI課（由Joachim Buhmann授課），那時波恩大學的教授Sebastian Thrun 正準備離開美國。我得查看我參加了他的哪一個演講週期，他在計算機視覺中有兩個講座，一個是模式識別（多數是舊版本的Duda&Hart的書中知識），一個是信息理論（類似於Cover和Thomas的書）。材料是非常有趣的，但也有點令人失望。正如我現在所知，人們停止了AI方面象徵性的工作，不再堅持用更多的統計方法來學習，這種方法學習的本質是，基於有限數量的觀察減少選擇正確函數的問題。計算機視覺講座，甚至學習的更少，且更依賴於明確的物理建模，以獲得正確的估計，例如，從視頻中重建運動。那時的方法比現在更加生理化和物理化。雖然神經網絡存在，但每個人都很清楚，他們只是「另一種函數逼近。」除了Rolf Eckmiller，和另一個我曾經在其手下工作過的教授之外，每個人都這麼想。Eckmiller在「神經計算」在某種程度上比傳統的計算好得多前提下建立了他的整個實驗室。這可以追溯到NIPS有着完整的路徑致力於研究神經元的生理學和工作機制的日子，甚至有人認爲在我們的大腦中有着本質性差異東西發生，也許是在量子水平，這增加了人的心靈，這種差異是研究真正智能機器的一大阻礙。

雖然Eckmiller很善於推銷他的觀點，但他的大部分工作人員都慶幸腳踏實地。也許這是一件非常德國化的事情，但每個人都很關心這些計算模型到底能不能做到，這也是研究中一直困擾我的問題。我畢業於2000十月，發表了相當牽強的碩士論文，試圖在學習和努力優化問題之間建立聯繫，然後開始了我的博士論文，並堅守在該領域進行研究直到2015。

機器學習的研究方法很多，但解決的本質問題基本一樣

雖然一直試圖證明行業的相關性，當它是一個長時間的非常學術性的努力，且社區是相當封閉的。有一些個人成功的故事，例如手寫字符識別，但許多公司在機器學習方面的研究失敗了。我記得有一個公司叫Beowulf Labs和NIPS，他們用一個視頻到處去招聘人才，承諾要成爲下一個「mathtopia」。在本質上，這是DeepMind的故事，招聘一羣優秀的研究人員，然後希望它會起飛。

整個社會也會圍繞着一個時尚到下一個。有一件奇怪的事情是，機器學習作爲一個整體，除了一大堆方法外，只有極少數本質不同的問題，如分類，迴歸，聚類等。它不像物理（我假設）或數學一樣，一些普遍認爲沒有解決的疑難問題，存在可以推進出最好結果的解決方案。這意味着，進步經常是做橫向的，通過用一個新的方法更換現有的方法，仍然以不同的方式解決同一個問題。例如，首先有神經網絡。然後支持向量機出現了，聲稱其效果更好，因爲相關的優化問題是凸面的。然後有boosting，random forests，等等，直到回到神經網絡。我記得，中國餐館進程（Chinese Restaurant Processes）「火」了兩年，但沒有人知道他們現在的意義是什麼。

大數據與數據科學

大數據與數據科學的時代已然到來了。當時立身於學術界，我總覺得大數據與數據科學肯定來自於外界，可能來自於像谷歌這樣切實處理龐大數據的公司。大規模學習確實是存在的，例如，生物信息學中基因組數據，但是我們應當尋找更爲有效的算法或近似算法來解決這些問題，而非蠻幹。

諸如谷歌這樣的公司最終證實了，我們可以運用龐大的數據完成一些事情，最終將改變人們對人工智能持有的主流觀點。有一些技術，如Hadoop和NoSQL，看似非常流行，能夠嫺熟地在市場上推廣並不斷革新，這些技術將免於現存體系中技術方面的限制。然而，這將對機器學習的研究者產生什麼影響？給我的印象是，這些研究者感到高興的是，大數據與數據科學時代的到來使他們最終得到認同，不過，他們也爲自己得到認同的方式感到悲哀。要理解這一點，我們要意識到，多數ML研究者並不是計算機領域的科學家，或者非常擅長，對編碼非常感興趣。他們中許多人來主攻物理，數學或其他學科，在這些學科領域中，他們卓越的數學訓練能力使其能夠熟練運用各種算法，併爲機器學習構建核心模型。

另一方面，Hadoop分佈式系統基礎架構偏科技性。用Java編寫，這種語言在當時被認爲專業性極強，與MatLab和Python兩種計算機語言相比，Hadoop的語言不免顯得複雜難懂。即使那些C++編程人員也會有相同的感覺，對他們來講，Java語言也會顯得冗雜，特別是在數值計算和模擬方面。但是，當前尚未找到解決這一問題的途徑，因而，他們將自己所做的一切都重新命名爲大數據，或者開始強調，大數據僅爲大規模計算提供基礎數據資源，而你需要專業的人才，方能弄懂這些數據信息。

這種解決方法應當是不會出錯的。我認爲，在一定程度上，這種區分依然是存在的。如果爲數據分析選擇合適的語言，Python當是最優之選，存在一些技術，如Spark，試圖通過綁定Python語言來分析數據，不論該種方法在性能方面是否講得通。

深度學習的迴歸

甚至在谷歌研發出人工智能技術DeepDream之前，神經網絡已經掀起迴歸熱潮了。有一些人，如Yann LeCun，一直以來堅持這種方法，但是，大概在10年前，有一些研究顯示如何使用分層訓練及其他訓練方法，訓練「深層」網絡，這種類型網絡的規模超出人們之前所能設想的。

得根據訓練實例進行評估，以訓練神經網絡，然後，調整所有權值進一步減小誤差。倘若沿着權重下降的方向記錄梯度值，那麼將從最後一層開始把錯誤傳播回來。不管怎樣，可以這樣理解，錯誤信息將逐層遞減，如此將增加多層次訓練網絡的難度。就我所知，許多人依然採用背景法，我不確定這種觀點是否依然正確。但是，可以肯定的是，可使用的數據量，工具及原始計算能力均發生了變化。因而，最初一些研究文獻點燃了人們對神經網絡的興趣，人們隨後開始繼續使用這些神經網絡，並在一些應用領域中取得了卓越的成就，這些神經網絡最早成功應用於計算機視覺，隨後在言語加工處理等領域。

我認爲，這種類型的神經網絡之所以能夠吸引人是因爲其多樣化的用途。有了這種方法，人們可以免於理解多種不同途徑的麻煩。此外，神經網絡擁有一個模塊化的結構，人們可以挑選出並組合不同層級和結構，將其用於解決各種各樣的問題。

谷歌當時發表了一篇關於DeepDream人工智能技術的優秀論文，文中提到他們能夠運用一個包含信息豐富的網絡衍生出一些數據，而我們人類具備即時學習結構與屬性的能力，很快便能學會運用這種網絡。因而，如今谷歌可以稱得上一家一流的人工智能公司。人工智能將拯救全世界。

尚待解決的一個基本問題

我曾經與許多學者交流過，他們對於深度學習的主導作用感到不滿，原因是這種方法能夠產生很好的效果，有時這種效果甚至過於理想化，但是，仍然不能幫助我們進一步理解人類大腦的工作原理。

我對此也持相同的看法，即這一基本問題仍未得到解決。我們是如何理解世界的？我們是如何創造出新概念的？深度學習依舊停留在模仿行爲的層面，儘管對於一些人來講，深度學習的效果已經相當不錯了，但我對此還不太滿意。此外，我認爲將太多智能因素歸功於這些系統，存在風險。對原始數據來講，這些系統的性能可能很不錯，但是，在其他方面，這些系統將以完全不同的方式運行。

儘管谷歌翻譯工具能夠允許人們跳過外國網站上發佈的內容，該種系統的性能仍有待改進，這一點是明白無誤的。有時我覺得沒有人會在意這一點，也許是因爲沒有人會因此受到傷害，不是嗎？但是，也可能是由於我的德國文化背景的緣故，我希望我們能夠以事物最初的模樣來看待這些事物的發展。

via：原文

PS : 本文由雷鋒網(公衆號：雷鋒網)獨家編譯，未經許可拒絕轉載！

文章來源：雷鋒網

喜歡這篇文章嗎？快分享吧！