華爲AI首席科學家裴健:企業所面臨的AI挑戰

 2017-09-08 14:15:00.0

都說人工智能的大潮已經到來,但是人工智能應該如何落地與產業結合,產生實際的效果?在ACM SIGKDD主席、加拿大西蒙弗雷澤大學計算科學學院教授裴健看來,產業AI化的核心是數據以及對於數據的挖掘,而對於企業來說,AI落地的過程中最關鍵的不是你用了多少新鮮的算法和新的數據,而是你能不能直接支撐業務部門進行業務手段和業務內容的創新。

在過去的數年中,裴健教授一直在與藍十字、SAP、IBM、華爲等多家公司進行着大數據方面的合作,對如何推進企業AI進程也有着深入的研究。2017年正值裴健教授的學術間隔年(Sabbatical Leave,歐美教授每隔數年可以有一年時間不承擔學校的教學工作,專心去做自己想做的研究與課題),而裴健教授曾向雷鋒網(公衆號:雷鋒網)提過,他希望能更好參與到一個用AI推進企業流程的完整過程中,因此裴健教授與華爲展開了更全面的的深入合作並擔任華爲AI首席科學家一職,幫助華爲更好地將AI與其業務結合起來。

AI與傳統產業結合有兩種思路:AI+和+AI。前者先打造一個AI平臺,在平臺上跑各種AI的應用,並將傳統產業轉到AI平臺上運行;後者則是在某些比較適合AI應用的領域先研究如何應用AI,用AI改進流程,並將其逐步推廣到其他傳統產業中來。裴健教授向雷鋒網介紹,「+AI」的思路在華爲內部供應鏈、風險控制、熱線客服等業務領域已經得到了明顯的業務進展,華爲在此基礎上提供了一系列端到端的解決方案,將供應商包含其中,以AI的方式來解決傳統企業的業務問題。

在正在召開的「華爲全聯接2017大會」上,裴健教授結合華爲雲的業務,爲我們進一步介紹了企業在做AI應用中的難點與挑戰。裴健教授認爲,AI只有使得業務產生價值,才能夠最終對用戶有真正的作用 。

華爲AI首席科學家裴健:企業所面臨的AI挑戰

(裴健教授演講中)

以下是雷鋒網整理的裴健教授演講主要內容。

我非常高興有機會能夠跟大家分享華爲在公有云上提供的AI服務,以及這些服務怎麼能夠幫助我們的企業迎接未來的挑戰。

我們都知道在最近的幾年裏面AI取得了前所未有的重大突破,產生了很多明星級的應用。爲什麼AI這個已經存在了幾十年的學科在最近的幾年會取得很大的突破?其中有兩個很關鍵的因素,第一個是在機器學習領域,我們有了一些開源的機器學習庫,如說Tensorflow、MXNet、Caffe、CNTK等,使得用戶可以很容易地編寫機器學習模型。但是編寫了一個機器學習程序並不意味着你就能夠訓練到一個好模型,你需要大量高質量的數據來訓練這個模型。處理大規模高質量的數據需要一個機器學習的平臺,而且最好這個平臺是基於雲上的。業界基於雲的機器學習平臺大幅度的降低了AI技術的使用門檻。 

AI目前的進展和數據與計算密不可分。首先,我們要獲得好的機器學習模型,就必須要有大量高質量的數據。但是,在我們很多的企業AI應用裏面缺乏大量高質量的數據,這是企業AI應用的一個重要的瓶頸。

如果我們大量的數據,我們可以訓練一個深度模型,我們需要對數以百萬計的參數進行調優,這需要巨大的計算資源。AI需要通用的計算資源,如CPU等,也需要一些專用的計算資源,如說PU、FPGA、TPU等。目前這些資源在體系結構上是排它的。一個子任務分給GPU去做了就會一直由GPU做。我認爲,未來體系結構應該逐步走向融合,有靈活的調度。

基於雲的AI平臺是處理AI所需要數據的關鍵中的關鍵。在企業環境當中有不同的機器學習的任務和應用,我們應該怎麼樣去選取這個模型呢?一個原則是模型的複雜度一定要與問題和數據的複雜度匹配起來,否則我們要麼出現過擬合或欠擬合的問題。不同的應用場景會往往有不同的複雜度和不同的計算量。要使企業的AI應用成功,不能夠只靠一個模型。我們需要一個豐富的平臺,提供豐富的AI模型和服務。

基於這樣一個考量,華爲AI架設一個通向業務智能的橋。無論我們是做AI+或者是+AI,我們堅信業務的最終業務價值是AI的最終價值,一定要解決最終業務問題。AI只有使得業務產生價值,才能夠最終對用戶有真正的作用,否則的話,空談AI沒有任何的業務價值。企業的業務價值永遠是需要端到端的解決方案。從算法到算法對大部分的實際應用沒有意義, 需要把數據平臺、集成商、領域專家和業務用戶協同起來。在企業業務當中的AI是一個以技術和服務平臺作爲基礎,連接數據、領域知識、應用和用戶,使各方面渾然一體、緊密結合、相互互動的解決方案。

基於這樣的理念,華爲AI推出了使能服務的框架。這是建立在華爲深厚的行業解決經驗。在最底層,我們有豐富的異構計算平臺,包括了各種的不同硬件資源和計算資源,如傳統的服務器及GPU、FPGA等設備,還有昨天剛發佈的Altas。

在這之上我們提供一層平臺智能服務API,覆蓋了流行的機器學習和深度學習平臺,如TensorFlow、Caffe、MxNet等。我們還提供了非常強大的圖計算能力,可以在秒級響應內處理千億條邊百億節點規模的圖。這裏面我們還提供了像搜索等一系列的基礎服務來提供平臺層的支持以及強大的推理功能。

在平臺API之上,我們有通用AI層,支持視覺、語音、自然語言理解等這些感知和認知功能。用戶可以在這層上構建通用的AI應用。

在這之上是我們的強項,領域和場景AI層,是我們理解行業、理解企業,提供行業領域的API,如我們面向智能、物流、風控、推薦問答、金融、製造等不同領域的API。對於一個行業來說,這層提供了一個Sandbox和一個工具集,可以用這些工具很容易搭建解決方案。另外,我們還提供解決方案的樣本。這是我們華爲把已有的成功經驗拿出來跟業界分享。用戶你可以根據這些藍本很容易修改定製獲得企業需要的解決方案。

我們後續會沿着這個服務框架逐步發佈大量的服務,歡迎大家使用,也歡迎合作方在這個平臺上貢獻他們的服務,共同建設企業AI應用的生態。

點擊此處下載裴健教授的演講Slide

文章來源:雷鋒網