現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

 2017-12-16 13:34:00.0

如果要歷數2017年在各大人工智能頂級學術會議上的國內企業,阿里巴巴必然是最活躍的公司之一。雷鋒網不僅在多個國際會議中均看到了阿里巴巴的身影和論文發表,在雷鋒網今年參加的IJCAI、CVPR、ACL、KDD、ACMMM、NIPS等六個頂級國際會議中,阿里巴巴均是白金級別贊助商,排名國內企業贊助頂級國際學術會議數量之首;在學術會議的組織參與程度上,阿里巴巴不僅是KDD 2017數據挖掘競賽的比賽贊助商及主辦者,同時還獲得了ACMMM 2020的舉辦權,同樣領跑於其他國內企業。

在吸引人工智能頂級人才上,阿里巴巴同樣也交出了一份不錯的答卷。在今年3月的阿里巴巴集團首屆員工技術大會上,馬雲宣佈啓動內部代號爲「NASA」的計劃,面向未來20年組建強大的獨立研發部門;10月,阿里巴巴宣佈成立全球研究院——阿里巴巴達摩院,3年投資1000億人民幣。2017年,王剛、任小楓、聶再清、李名揚等國際級人工智能人才加盟阿里巴巴,而在此之前,前微軟亞洲研究院副院長王堅、IEEE 院士華先勝、普渡大學終身教授司羅,前微軟研發合夥人周靖人等科學家也紛紛選擇了阿里作爲科技研究的新根據地。堅實的人才儲備不僅使得阿里在各人工智能學術會議的表現步步走高,也爲阿里的人工智能產品商業化打下了良好的基礎。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

(阿里巴巴人工智能實驗室高級專家張碩)

相應,在人工智能的頂級學術會議上,阿里也在不斷通過新的嘗試輸出自己的對外影響力。近日,在美國加州長灘舉辦的 NIPS 2017 大會上,阿里巴巴人工智能實驗室高級專家張碩、阿里巴巴首席工程師(Principal Engineer)李欣、阿里巴巴iDST院長金榕分別開設了迷你研討會,對各自領域在人工智能領域的工作及實踐進行了介紹。


阿里巴巴人工智能實驗室:打造下一代人機交互平臺

阿里巴巴人工智能實驗室於2016年成立,目前擁有200餘名研究員和科學家,負責人爲淘寶首任產品經理、智能生活事業部總經理「淺雪」(陳麗娟),其定位更多偏向於消費級產品的落地,如實驗室的第一款智能語音終端設備「天貓精靈 X1」,以及背後的智能語音助手和開發者平臺 AliGenie等。

阿里巴巴人工智能實驗室自從成立以來一直保持低調,今年7月5日的智能音箱「天貓精靈 X1」發佈會是其成立一年以來的首次公開亮相。而在 NIPS 上,人工智能實驗室也就自己所做的人工智能相關工作進行了講解,以吸引更多的人才加盟。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

(天貓精靈x1智能音箱)

在 NIPS 大會正會第一天,阿里巴巴人工智能實驗室的高級專家張碩介紹,人工智能實驗室主要任務是打造下一代的人機交互平臺,在感知和推理能力(包括語音識別、語言理解、計算機視覺等)、知識數據庫(包括知識圖譜、用戶配置文件等)、按需行爲(包括服務和流動性等)等三方面創造人性化的機器。隨後張碩對實驗室在今年推出的三個產品:智能音箱、語音開放平臺ALiGenie和AR開放平臺進行了介紹。

據雷鋒網瞭解,張碩在2011年於康涅尼格大學獲得電子工程博士學位,在加入阿里巴巴之前,他是UTRC的主管工程師, 負責Sikorsky載人無人機SARA的環境感知系統,此外他還曾擔任著名無人車創業公司nuTonomy美國感知技術組負責人。

搜索事業部:大數據高併發環境的個性化搜索與推薦

作爲一家有着80億款商品在線的電商公司,搜索對於阿里巴巴的重要性不言而喻。據阿里巴巴搜索事業部研究員李欣介紹,從2013年的MPI(Message passing interface)機器學習平臺算起,阿里巴巴的搜索技術每年都會有一次大的更新換代,最近使用的是包含在線深度學習平臺與離線深度學習平臺結合的異構計算,機器學習與深度學習在阿里的搜索體系中佔據着重要的位置。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

(阿里搜索事業部研究員李欣)

在具體業務上,阿里巴巴搜索團隊爲淘寶、天貓、聚划算、淘搶購、天天特價、淘金幣等業務提供搜索、個性化引擎和圖像引擎服務,該團隊的主要研究方向包括:構建更大規模的排序系統的機器學習平臺,提升大規模數據下系統對用戶行爲的快速反應能力、提升算法的效率。

李欣爲我們舉了阿里在商品搜索和推薦中遇到的具體問題的例子。「例如在雙11的時候,有超過100萬的用戶購買了阿里巴巴的天貓精靈X1智能音箱,無論是商品的價格、用戶的偏好以及相關產品的推薦,我們都需要進行相應的調整。」

 

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

對於這個問題,搜索團隊採用的是一種被稱爲「深度用戶感知網絡」(Deep User Perception Network,DUPN)的技術,通過對用戶信息和商品信息的分析實現多個不同的任務,如預測用戶的商品點擊率、價格偏好區間、對該用戶的商品排序等。DUPN的最大特點是基於環境變化的注意力機制,阿里採用的是兩套不同的深度學習平臺,即在線深度學習平臺與離線深度學習平臺訓練並進行同步的方法,在正常情況下,兩套平臺每天同步一次,而在特殊的場景(如雙十一),線上模型可捕捉到環境變化,然後調整參數,實現這兩套平臺的實時同步,對用戶的行爲進行更精準的分析和推薦。從結果來看,DUPN 要比 DNN、CNN 和 LSTM 也有着更好的效果。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

(實時同步示意圖)

李欣博士於伊利諾斯香檳分校獲得計算機博士學位。在加入阿里巴巴前,他曾在Yahoo和Bing擔任主任研究員及首席研發經理,在覈心搜索排名及查詢上發表了20餘篇論文,並有6項美國專利。在未來阿里的搜索上,李欣博士表示在覆蓋新用戶和新產品、多模態交互和用語音和文字的交互進行產品推薦等方面都是搜索的重點研究方向。

iDST:阿里巴巴的深度學習應用

在正會的最後一天,阿里巴巴iDST院長金榕在阿里巴巴展區進行了《阿里巴巴的深度學習應用》(Deep Learning at Alibaba)的分享。作爲在電商領域有諸多業務的企業,阿里巴巴對深度學習有很大的需求,尤其在信息檢索(搜索和推薦系統)、語音技術(自動語音識別、語音合成,對話管理)、自然語言處理(拼寫檢查、依存語法、問答和機器翻譯)等領域,阿里將深度學習應用到業務中時會遇到許多學界人士不可能遇到的問題和新的挑戰。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

(阿里iDST院長金榕在阿里展位進行技術分享)

例如在計算機視覺領域,金榕舉的例子是 2014 年上線、通過搜索圖片找產品的拍立淘。目前拍立淘擁有現在已經有超過1億件商品的30億張圖片,每天有至少1500萬活躍用戶。這項業務的基礎就是通過深度學習對結果進行排序,阿里研究人員通過用戶記錄的三元組數據(查詢圖片、點擊圖片和未點擊圖片)來訓練模型的排序損失函數,從而得到排序結果。

現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

另外,金榕還展示了阿里在模型壓縮方面的成果。現在的深度學習模型變得越來越複雜,甚至有的模型已經超過了1000層,參數空間達到了10億級。這使得深度網絡神經學習在優先的存儲器和計算資源下難以運行。金榕在此提到了阿里的兩種解決方案:模型壓縮和淺網模型的構建,在演講中,金榕提出了一個利用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的low-bits量化神經網絡的框架來壓縮模型。ADMM是一種求解優化問題的計算框架,它能夠將連續解和離散解結合起來,利用連續解的梯度來指導離散解的搜索。此外爲了更有效地運行ADMM,他們還開發了額外梯度下架方法(extra gradient descent method)來解決優化問題,這種方法能夠加速收斂。

現場:研討會反響熱烈

隨着馬雲在國際舞臺的頻頻亮相,不少外國人對於阿里巴巴和和淘寶均有着一定的認知,這使得阿里巴巴在向現場參會者介紹時可以跳過了「阿里巴巴是誰」的環節,直接進入機器學習、深度學習等技術在阿里巴巴的應用的介紹。

雷鋒網注意到,在諸多參加 NIPS 的中國展商中,阿里巴巴是唯一三天在展位現場都開展技術分享的中國企業,而這幾次迷你研討會均吸引了不少參會者的關注,爲阿里貢獻了不少的人流量。在演講結束後,還有不少參會者現場進行技術交流,以及詢問如來阿里人工智能實驗室、iDST實習及達摩院相關事宜。

隨着人工智能的火熱,吸引頂級人才的成本越來越高,在傑出人才百萬年薪計價的今天,國內的頂級人工智能企業需要在像 NIPS 這樣的學術會議上「Show muscle」,引起更多人工智能學生和研究者們的注意。

據雷鋒網現場瞭解,不少參會學生均將「工作與自己領域是否相符」和「團隊Leader的技術實力」作爲在申請未來工作中最重要的衡量指標,相比起傳統展會上各家公司力推的產品和公司介紹,像阿里巴巴這種「技術大牛現身說法」的分享會也有着更好的效果,或許在不久的將來,類似的研討會也將成爲各大展商展示自己實力的「標配」。


現場:阿里三場技術研討會「Show Muscle」,展示人工智能應用創新 | NIPS 2017

文章來源:雷鋒網