開發者入門必讀:最值得看的十大機器學習公開課

 2017-01-13 18:49:00.0

開發者入門必讀:最值得看的十大機器學習公開課

在當下的機器學習熱潮,人才匱乏十分顯著。截至目前,國內開設人工智能(AI)專業的高校不多,相當多的開發者是跨界入門,需要自學大量知識並摸索。因而優質的學習資源至關重要。因此,雷鋒網蒐集了全世界範圍內最受歡迎的機器學習課程,整理成這份「機器學習十大入門公開課」盤點,集中呈現給各位。這份推薦榜頗費心血,綜合考慮了難易、側重點、時效性等諸多因素,希望能幫助大家找到最適合自己的學習資源。

這些課程全部免費開放,但有些需翻牆,有的缺少中文字幕。

1. 吳恩達「機器學習」公開課

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:機器學習 Machine Learning

  • 主講人:吳恩達 Andrew Ng

  • 授課機構:斯坦福大學

  • 發佈平臺:Coursera

  • 語言:英語,漢語字幕

  • 網址:https://www.coursera.org/learn/machine-learning

無論國內國外,這是最火的機器學習入門課程,沒有之一。無數新手都是通過這門課對機器學習初窺門徑。吳恩達老師用極其清楚直白的語言,對機器學習的幾種主要算法做了初步介紹。

這門課最大的特點,是它側重於概念理解而不是數學。數學推導過程基本被略過,重點放在讓初學者理解這背後的思路。另外,它還十分重視聯繫實際和經驗總結:1. 課程中吳恩達老師列舉了許多算法實際應用的例子 2. 他提到當年他們入門 AI 時面臨的許多問題,以及處理這些難題的經驗。

課程中代碼教程使用的是 Octave/MATLAB,因此不需要會 Python、C 語言,適合沒有編程基礎的新手。

總結起來,這門課對數學、統計、IT 基礎薄弱的童鞋十分友好。其實很多機器學習入門課,都是假定學生已修完這一門,於是重點對其進行補充——講解這門課程中吳恩達老師未涉及、或是涉及不深的話題。因此,對於機器學習 「一張白紙」的童鞋,雷鋒網強烈推薦從這門課起步,然後選擇其他入門課程進階,以在腦海中建立起更全面的知識體系。另外,Coursera 上這門課的論壇十分活躍,不管拋出什麼問題都會有人解答,算是一個額外的好處。

彩蛋:網易公開課上有吳恩達老師在斯坦福授課的實錄視頻。內容比較深入,但時間比較久了,可作爲進階姊妹篇。地址:http://open.163.com/special/opencourse/machinelearning.html

2. 加州理工 「從數據中學習」

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:Learning from Data,網易公開課譯名爲「加州理工學院公開課:機器學習與數據挖掘」

  • 主講人:Yaser Abu-Mostafa

  • 授課機構:加州理工學院

  • 發佈平臺:edX(原版),網易公開課

  • 語言:英語,網易有漢語字幕

  • 網址: https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516,edX;

    http://open.163.com/special/opencourse/learningfromdata.html,網易。

這同樣是一門機器學習的入門課,但並不簡單。該課程強調數據,是因爲機器學習與各領域的大數據處理應用(比如金融、醫療)聯繫十分緊密。這門課內容涵蓋基礎理論、算法和應用,平衡了理論與實踐,既覆蓋數學統計,也包含啓發式的概念理解

課程結構是這樣的:

  • 什麼是學習?

  • 機器能學習嗎?

  • 怎麼做到?

  • 怎麼做好?

  • 經驗教訓。

不少人評論該課程結構就像講故事,它有助於學習者形成對機器學習概念和模型深度、直覺性的理解。學習者公認它內容非常充實,但對作業模塊的爭議很大:有人認爲難度偏高並且缺乏反饋,有人認爲它是網上能找到的、最好的機器學習練習。

彩蛋:Yaser Abu-Mostafa 出版了同名著作 《Learning From Data》,可作爲該課程的教材和補充。

3. Tom Mitchell 機器學習課程

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:機器學習 Machine Learning

  • 主講人:Tom Mitchell

  • 授課機構:卡內基梅隆大學(CMU)

  • 發佈平臺:CMU 官網

  • 語言:英語

  • 網址:http://www.cs.cmu.edu/~tom/10701_sp11/

這門課是學界人士的最愛,是入門課程之中較全面、高階的一門。課時爲 15 周,遠超大多數機器學習慕課。其覆蓋的話題非常廣,按先後次序包括:代數和概率論,機器學習的基礎工具,概率圖模型,AI,神經網絡,主動學習,增強學習。課程內容和練習十分簡潔明白,概念解釋清楚到位。

Tom Mitchell 是 AI 領域德高望重的老牌宗師,他的《Machine Learning》 (中文版爲《計算機科學叢書:機器學習》),是最經典的機器學習教科書之一。但因爲時間久遠,涉及的一些概念與今天的開發者並沒有太大關聯,更適合需要了解人工智能來龍去脈的大學師生。這門課程與之類似,能幫助學習者理清機器學習的發展脈絡。它適合計劃進行系統性學習、投入大量時間的人。

對於初學者,建議至少聽完吳恩達的機器學習課程之後,再修這一門。

4. 臺大林軒田老師的機器學習基石

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:機器學習基石

  • 主講人:林軒田

  • 授課機構:臺灣大學

  • 發佈平臺:Coursera

  • 語言:漢語

這是爲漢語學子量身定做的入門課,相當於臺灣大學機器學習課程前半學期的課,教給大家的是機器學習最核心的知識。林老師是教科書《Learning From Data》 的作者之一,是華人機器學習領域年輕有爲的青年學者。這門課程十分用心細緻,內容比吳恩達老師的入門課程稍稍充實一些。

林老師表示,針對頂級機器學習公開課全是英語授課的現狀,不少學生反映英語教學有不易吸收之處。因此,借推出這門課程,希望幫助漢語爲母語的學生減少入門難度。

針對如何讓學生接受枯燥的算法,林老師說道:

「我們的課程設計中,大家會看到我們把對算法與數學式的推導,以‘解決問題’的過程方式呈現。也就是說,我們對算法的介紹是環繞着‘爲什麼’出發的,當同學們腦中有‘爲什麼’的時候,就有目標去理解這些算法與數學式的內容了。」

《Learning From Data》 也可作爲這門課的教科書。學習 Yaser Abu-Mostafa 的課程有不解之處,可與這門課互相印證。

目前該課程已在 Coursera 下架,何時重開尚屬未知。好在網易公開課、Youtube 倒是有全套視頻,地址是:http://c.open.163.com/coursera/courseIntro.htm?cid=938 以及 https://www.youtube.com/playlist?list=PLXVfgk9fNX2I7tB6oIINGBmW50rrmFTqf。更多課程資料可從臺大官網找到(網頁爲英語)http://www.csie.ntu.edu.tw/~htlin/mooc/。

彩蛋:臺大 2015 年機器學習課程的大綱以及學習資料(PPT):https://www.csie.ntu.edu.tw/~htlin/course/ml15fall/,可作爲補充。順便提一句,林老師把臺大後半學期的課程開成另一門 Coursera 課程「機器學習技巧」,作爲進階。目前 Coursera 也已撤下。網易公開課地址爲 http://c.open.163.com/coursera/courseIntro.htm?cid=1664。

5. 谷歌人工智能入門

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:人工智能入門  Intro to Artificial Intelligence

  • 主講人:Peter Norvig,Sebastian Thrun

  • 授課機構:谷歌

  • 發佈平臺:優達學城 Udacity

  • 語言:英語,漢語字幕

  • 網址:https://cn.udacity.com/course/intro-to-artificial-intelligence--cs271

該課程久享盛名,是 AI 入門最好的公開課之一(雷鋒網注:有人認爲可以去掉「之一」)。

嚴格來說,它並不是一門機器學習課程。但其中有一週的主題是機器學習,它還介紹了另外幾個 AI 主要領域:概率推理、信息檢索、機器人學、自然語言處理等。鑑於學習機器學習的童鞋,幾乎都會對 AI 這個大學科有興趣——這門課程便是探索機器學習周邊與交叉領域的絕好機會

兩位主講者,Peter Norvig 和 Sebastian Thrun,一個是谷歌研究總監,一個是斯坦福著名機器學習教授,均是與吳恩達、Yann Lecun 同級別的頂級 AI 專家。

需要強調的是,該課程傾向於介紹 AI 的實際應用。課程練習廣受好評。

6. UBC 本科生的機器學習課程

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:面向本科生的機器學習課 Machine Learning for Undergraduates

  • 主講人: Nando de Freitas

  • 授課機構:英屬哥倫比亞大學(UBC)

  • 發佈平臺:Youtube

  • 語言:英語

  • 網址:https://www.youtube.com/playlist?list=PLE6Wd9FR--Ecf_5nCbnSQMHqORpiChfJf

Nando de Freitas 是機器學習領域非常傑出的學者。他的這門課很適合作爲吳恩達老師「機器學習」的進階課程,因爲:1. 「機器學習」省略掉的一些概念,可以在這門課中找到。2. 「機器學習」課 不重視數學,而數學是這門課的重點內容。Nando de Freitas 對諸如概率論、log likelihood 等基礎數學原理做了很好的講解,並以此爲基礎介紹更高級的數學、統計概念。

對於機器學習新手,完全略過數學細節是很危險的,這門課會幫助你打下基礎。

但是,它錄製於 2012  年,時間也比較久了。因此,雷鋒網特意奉上彩蛋一枚。

彩蛋:Nando de Freitas 2013 年轉入牛津大學任教。這是他 2014-2015 學年在牛津的全套深度學習課程,包括視頻、PPT 以及練習:https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/ (視頻保存在 Youtube,需翻牆)。

7. Yann Lecun 深度學習公開課

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:深度學習 Deep Learning

  • 主講人:Yann Lecun

  • 授課機構:法蘭西學院

  • 發佈平臺:法蘭西學院官網

  • 語言:法語,英語字幕

  • 網址:https://www.college-de-france.fr/site/en-yann-lecun/course-2016-04-15-11h00.htm

Yann Lecun 在 2016 年初於法蘭西學院開課,這是其中關於深度學習的 8 堂課。當時是用法語授課,後來加入了英文字幕。

作爲人工智能領域大牛和 Facebook AI 實驗室(FAIR)的負責人,Yann Lecun 身處業內機器學習研究的最前沿。他曾經公開表示,現有的一些機器學習公開課內容已經有些過時。通過 Yann Lecun 的課程能瞭解到近幾年深度學習研究的最新進展。該系列可作爲探索深度學習的進階課程。

 8.  Geoffrey Hinton  深度學習課程

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:神經網絡用於機器學習 Neural Networks For Machine Learning;網易譯名「神經網絡的機器學習」

  • 主講人:Geoffrey Hinton

  • 授課機構:多倫多大學

  • 發佈平臺:Coursera、網易公開課

  • 語言:英語,漢語字幕

  • 網址:https://www.coursera.org/learn/neural-networks,Coursera;

    http://c.open.163.com/coursera/courseIntro.htm?cid=77,網易

深度學習必修課程,講師爲該領域的一代宗師 Geoffrey Hinton。

這門課程聚焦於神經網絡和深度學習,是深入瞭解該領域最好的課程之一(雷鋒網注:很多人認爲可以去掉「之一」)。

課程官方介紹:

「(你會在這門課)學習人工神經網絡以及它們如何應用於機器學習,比方說語音、物體識別,圖像分割(image segmentation),建模語言、人體運動等等。我們同時強調基礎算法,以及對它們成功應用所需的實用技巧 。」

這門課錄製於 2013-2013,時效性上不如 Yann Lecun 的法蘭西學院公開課,建議兩者結合。另外,它要求微積分、Python 基礎,涉及許多專有名詞,對初學者難度較大,需自己查找相關資料。

9.  哥倫比亞大學的機器學習公開課

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:機器學習 Machine Learning

  • 主講人:John W. Paisley

  • 授課機構:哥倫比亞大學

  • 發佈平臺:edX

  • 語言:英語

  • 網址:https://www.edx.org/course/machine-learning-columbiax-csmm-102x

在這份大牛雲集的榜單中,該課程的主講者——哥倫比亞大學副教授 John Paisley,只是一名相對普通的青年學者。但是,這門課程將於兩天後,也就是 2017 年 1 月 16 日首次開課。這使它成爲時下最新的機器學習入門課程。要知道,近一兩年來人工智能和機器學習的發展完全可以用「日新月異」來形容——涌現的新方法、新理論,即便是一流專家也有目不暇接之感。換句換說,三、四年前的課程,可能現在有許多內容已經過時了。

這是 Yann LeCun 提醒大家注意學習資源時效性的原因所在。

可惜許多一流的機器學習公開課,距離錄製都有些久了。我們知道一堂公開課背後所耗費的巨大人力。因此,對於部分課程在近兩三年並沒有更新的事實,倒也不能去怪主講者和平臺。但這使得比較新、時效性較強的課程格外可貴。

這門課中,學習者會了解到機器學習的算法、模型和方法,以及它們在現實生活中的應用。

由於是首次開課,尚沒有對該課程的反饋。但鑑於哥倫比亞大學的研究、教學實力,課程品質應當值得期待。

10. MIT 進階課程

開發者入門必讀:最值得看的十大機器學習公開課

  • 課程名稱:機器學習 Machine Learning

  • 主講人:Tommi Jaakkola

  • 授課機構:麻省理工學院(MIT)

  • 發佈平臺:MIT Opencourseware

  • 語言:英語

  • 網址:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-867-machine-learning-fall-2006/index.htm

這是一門研究生水平的機器學習課程,難度較高。可惜的是,MIT 並沒有提供課程視頻,而是以參考書目和課堂筆記的形式,讓我們得以一窺該課程的內容。小編認爲,這些學習資源的價值仍舊不可估量。因爲如此,相比常規公開課,它不會耗費過多時間,非常適合有一定基礎的學習者印證自己所學

小結

這就是雷鋒網爲您盤點的十大最有價值的機器學習入門公開課。這些課程有淺有深,分別對機器學習不同領域、方面有所側重。各位童鞋可根據自己所需,自行選擇最適合自己的課程。不過,小編必須提醒各位,所有盤點都不可避免得摻雜了主觀因素。雖然雷鋒網(公衆號:雷鋒網)已盡力按照課程質量與業內人士的評價來制定該推薦榜,但自知無法做到十足的公正客觀。比方說,該榜單傾向於機器學習的「入門」,而非開發者進階;傾向於概念、算法學習,而非實戰技巧(比如 Python 教程);傾向於把全世界範圍內最好的課程推薦給諸君,而對英語基礎較差的學習者照顧不足。榜單之外尚有許多有價值、適應不同層次人士需求的公開課。因此,雷鋒網特意列舉了幾個比較好的系統性機器學習課程以及學習平臺,彌補該榜單不足,以供參考。

友情提醒,以下包含收費課程。

系統性課程:

  • 優達學城(Udacity)提供的的 「機器學習工程師」納米學位,中文字幕,谷歌、滴滴參與授課,收費。

    https://cn.udacity.com/course/machine-learning-engineer-nanodegree--nd009

  • 華盛頓大學的「機器學習專業」系列課程,Coursera 平臺,收費,共六門課。

    https://www.coursera.org/specializations/machine-learning

  • 約翰·霍普金斯大學的「數據科學專業」系列課程,Coursera 平臺,收費,共十門課。

    https://www.coursera.org/specializations/jhu-data-science

  • 密歇根大學的「Python 的應用數據科學專業」系列課程,Coursera 平臺,收費,共五門課。適合需要學習 Python 實戰技巧的機器學習開發者。

    https://www.coursera.org/specializations/data-science-python

平臺推薦:

國外的 Coursera、edX、優達學城(Udacity)、Udemy;國內的網易公開課、七月在線都集中了相對優質的學習資源。當然,英語不錯的童鞋推薦國外學習網站,尤其它們的問答論壇非常有幫助。

對於英語基礎不是那麼好的童鞋,Coursera 和優達學城很重視中國市場,它們的大部分機器學習資源都添加了漢語字幕。對於 edX 和可汗學院的部分課程,網易公開課有字幕翻譯。

對於需要在數學、統計方面補課的童鞋,除了以上幾個平臺之外,強烈推薦可汗學院 Khan Academy, 它的數學課非常有名,連比爾·蓋茨都推薦給他子女,很適合從零起步打基礎。

另外,雷鋒網旗下 「AI 科技評論」會定期舉辦「硬創公開課」,邀請業內專家對機器學習熱點問題進行深度討論,並問答 AI 科技評論讀者的問題 。上期,我們就請來新加坡國立大學的馮佳時教授剖析了 GANs (生成對抗網絡)。更多信息請關注 AI 科技評論微信公衆號。

相關文章:

機器學習十大算法都是何方神聖?看完你就懂了

入門必讀 機器學習六大開發語言

Python、R、Java、 C++ 等:從業界反饋看機器學習語言趨勢

乾貨分享 | 深度學習零基礎進階大法!

開發者入門必讀:最值得看的十大機器學習公開課

文章來源:雷鋒網