北京時間 12 月 11 日晚間,Google 宣佈推出圍棋教學工具 AlphaGo Teach,而在 12 月 12 日晚間,僅僅一天之後,又迎來另一條引爆媒體圈的消息:DeepMind 資深研究員的黃士傑宣佈離開 AlphaGo 項目。
他在 Facebook 上發表臨別感言:
AlphaGo 教學工具已經發布,這也是我 AlphaGo 研究之旅的美好句點。我已經轉到 DeepMind 的其他專案,也將在深度學習與強化學習的 AI 研究上持續探索與精進。
感謝大家的關注,很高興 AlphaGo 所帶給大家的驚喜與美妙的時光。我也期待 AlphaGo 教學工具對圍棋界所產生的積極作用。未來,請大家持續關注 DeepMind 與我們其他的專案。
提到黃士傑,最廣爲熟知的是在 2016 年 3 月,作爲 AlphaGo 的「手」,對戰李世石——他將 AlphaGo 的棋步下到棋盤,並將李世石的棋步再輸到電腦上。
黃士傑本科畢業於臺灣交通大學資訊工程專業,後於臺灣師範大學資訊工程所獲得碩士與博士學位,他本身也是業餘六段的圍棋棋手。黃士傑與 AlphaGo 的不解之緣,要從他的業餘愛好——圍棋說起。曾經獲得臺灣大專杯業餘圍棋冠軍的他,也曾在校內創辦過圍棋社。而從術業方面,黃士傑的指導教授林順喜,所在的實驗室正是專研各類棋類程序的開發。黃士傑的博士論文就是以「應用於電腦圍棋之蒙地卡羅樹搜索法的新啓發式演算法」。
在 2010 年,黃士傑以妻子爲名所設計的系統 Erica 在日本舉辦的國際奧林匹克競賽中擊敗了日本程序員尾島陽兒所開發的 Zen(業餘五段水平),榮獲當年的金牌,轟動一時。
2011 年,他在加拿大阿爾伯塔大學擔任一年的研究員後,2012 年被英國的 DeepMind 納入麾下,此後一直在 AlphaGo 項目中進行探索與研究。
而他最近一次出現在大衆的視野,是在上個月。11 月 10 日,在臺灣中研院舉辦的「2017 年人工智能年會」上,黃士傑首次爲大家講述 AlphaGo 的研發過程,並且還透露新一代 AlphaGo Zero 的能力還沒達到極限。
在演講中他表示,AlphaGo 的研發過程,有四個時刻對他影響很大。
一是在韓國戰勝李世石。「當我們開始做 AlphaGo 時,沒想到它會變得那麼強。在韓國贏了李世石後,DeepMind 首席執行官 Demis Hassabis 立刻發了一個推特,說「我們登上月球」(We landed it on the moon.)。我明白 Demis 那天的感覺,這是我們團隊的一小步,但卻是人類的一大步。」
「第二個時刻,是我在網絡上操作 AlphaGo 升級版「Master」,下了 60 盤棋。」他表示,自己從小喜歡下棋,在臺灣是業餘六段。「Master 在網絡上對弈的對象,都是我從小崇拜的人。雖然不是我真正在下棋,但卻感到非常榮幸。」
第三個時刻,是今年在烏鎮的人機大戰上操作 AlphaGo 和世界冠軍柯潔九段下棋。他說道,「柯潔還不滿 20 歲,非常年輕,當天比賽氛圍和李世石對弈時很不同。我記得在韓國比賽,能感受到李世石承受到很大的壓力,感覺他是在爲人類而戰。我當時坐在他對面,也儘量保持謹慎的態度,不喝水、不去上洗手間。但到了第二次和柯潔對弈,比較像是人機合作的氣氛,柯潔還走過來說:『黃博士,很榮幸跟 AlphaGo 下棋』。」而他也表示,如果 Master 是無敵的,那機器存在的價值應該是要幫助棋手擴張思路、擴展圍棋理論。
黃士傑表示,第四次於他的重要時刻,在於 AlphaGo Zero 的出現。通過餵給 AlphaGo Zero 圍棋規則,讓它自己學會下棋,無疑是人工智能的又一次突破。而隨着系統能力的不斷提升,人類在其中的作用也越來越小,甚至不再需要人類的幫助。而黃士傑也表示,這會是一個趨勢,「AlphaGo 有 99% 的知識是我做的,AlphaGo 能走到這一步,我已經很滿足,找到了收尾。」
或許,這也是黃士傑選擇退出 Alpha Go 項目的根本原因。
而他昨天正式宣佈離開 AlphaGo 項目,正如他在十一月的演講中所說,「AlphaGo 能走到這一步,我已經很滿足,找到了收尾。」