2016年人工智能領域的總結與思考:未來將面臨的五大考驗

 2017-01-03 17:53:00.0

這兩天,有朋友感慨道:「2016年對人工智能來說是意義非凡的一年,或許在技術領域的感知並不明顯,在商業層面的「成功」卻是前所未有的。」是呀,從年初AlphaGo和李世石的圍棋大戰,再到一場場和人工智能有關的發佈會。不管怎樣,人工智能終於跳出了實驗室的禁錮,成爲活躍在科技領域的核心力量。

一、人工智能時代正在到來

每當一個事物興起的時候,隨之而來的就是大量的觀點與推測,其中最受歡迎的往往是那些最大膽的;而後每增加一個論據,都會讓我們對這個觀點更加深信無疑。就像從Alpha Go戰勝李世石後,人工智能在輿論中強勢回暖,而後李彥宏在世界互聯網大會上的言論,也再度加強了人們對它的關注。

不僅百度,馬化騰在2015年6月的演講中也說道:人工智能是我最想做的事情。馬雲也在2015年5月內部信中寫道:未來三十年雲計算、大數據、人工智能等技術將會讓無數的夢想成真

目前國際互聯網巨頭紛紛入場, 亞馬遜的 Alexa、蘋果的 Siri、微軟的 Cortana,作爲人工智能的第一塊敲門磚,已經被較爲廣泛的使用;搜索、翻譯、地圖、無人車,深度學習的影子無處不在,人工智能正在重構人類的生活。

同時,伴隨互聯網的高速發展和底層技術的不斷進步,人工智能所需的「能源」正在不斷完善。

  • 數據量: 2000年至今,互聯網及移動互聯網的高速發展使得數據實現了量的積累,據IDC預測,2020年全球的大數據總量將爲40ZB,其中有七成將會以圖片和視頻的形式進行存儲,這爲人工智能的發展提供了豐厚的土壤。

  • 深度學習算法:多倫多大學教授Geoffrey Hinton(致力於神經網絡和深度學習研究)的學生在業內知名的圖像識別比賽ImageNet中利用深度學習的算法將識別錯誤率一舉降低了10%,甚至超過了谷歌,深度學習進而名聲大噪。2015年,微軟亞洲研究院視覺計算組在該項比賽中奪冠,將系統錯誤率降低至3.57%,已經超過了人眼。

  • 高性能計算:GPU響應速度快、對能源需求低,可以平行處理大量瑣碎信息,並在高速狀態下分析海量數據,有效滿足人工智能發展的需求。

  • 基礎設施成本:雲計算的普及和GPU的廣泛使用,極大提升了運算效率,也在一定程度上降低了運營成本。IDC報告顯示,數據基礎設施成本正在迅速下降,從2010年的每單位9美元下降到了2015年的0.2美元。

與此同時,巨頭和創業公司也相繼投入資源和成本進行商業化探索,但技術本身尚有足夠大的成長空間,當前仍處於早期階段。

二、人工智能帶來的機會

我們看到,目前人工智能領域的企業主要集中於以下三個層面:

  • 基礎層:關注人工智能基礎支撐硬件或數據平臺基礎;

  • 技術層:包括有關機器識別與深度學習的算法和技術設計;

  • 應用層:包括通用應用和行業垂直應用等。

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

圖片來源:易觀智庫

在極客幫創投創始合夥人蔣濤看來,大公司在這三個層面贏家通吃,而小公司只能依靠單點突破,以及在傳統行業優勢上進行突圍。

大公司(100億市值以上)的主戰場在於爭奪未來人工智能的制高點,這分爲兩個方向,第一個方向是爭奪未來人工智能的入口,包括家居的入口、汽車的入口等等,這些未來的入口扮演着比較重要的交互作用,例如Google的語音交互,百度的百度大腦。

第二個方向是生態系統的競爭,入口很容易切換,那麼就要通過生態提高切換成本,通過開源技術,通過推薦算法,當然也要依靠於物聯網的延伸與發展。而像京東、噹噹這類的大公司,他們最大的競爭力在物流和海量的數據上,所以在技術上可以購買,但並不那麼着急。

小公司的主戰場在垂直領域的應用,通過人工智能的浪潮來改進尚未完成移動化的行業。例如金融行業,它在人工智能時代的市場規模、空間應該會比移動時代更加廣大;例如企業級的服務,現在在國內處在非常落後的狀態。蔣濤說:「相對來說容易做的事情已經做完了,剩下的事情都是硬骨頭,但我相信還會有跑出來大的公司,當然有數據的公司會更容易跑出來。」

實際上,目前人工智能的應用和落地方式還極其有限。幾乎所有人工智能的最新進展都是通過一種類型來完成:輸入數據(A)快速生成簡單的迴應(B),舉個例子:

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

這麼一個簡單的輸入A和輸出B將改變許多行業,而構建由 A→B 的技術被稱爲監督學習。A→B 系統發展速度很快,這其中深度學習很大程度上受大腦的工作原理啓發。但A→B 系統距離科幻片中存在情感的機器人還差得很遠,人類的智能也遠遠比A→B系統高級得多。

那麼A→B這個系統能做什麼?關於其顛覆性影響,這裏列一個法則:如果人類進行一項思考時間少於一秒的任務,那麼不遠的將來或許我們能用人工智能自動化完成這項任務。

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

吳恩達,百度首席科學家,人工智能和機器學習領域國際上最權威的學者之一。

百度首席科學家吳恩達表示,人們在人工智能應用方面已經做了很多有價值的研究:在監控視頻中檢測可疑行爲、汽車即將撞到行人時自動急剎車、自動刪除網上的黃暴內容,上述任務均可在一秒之內完成。當然,這些技術更適合與大的產業業務相結合。

互聯網實現了基礎設施可以跑、數據可以連,人工智能其實在另外一個維度上提升了我們整個的應用效率,它試圖解決的是生產資料及勞動力上的問題。人工智能是產業智能化升級的強大工具,正在改變包括通信、醫療、教育等在內的所有領域。

1、通信領域

通信網絡一般有兩大任務,一個是網絡的控制,一個是網絡的管理和維護。網絡控制就是怎麼樣在一個通信網絡中進行有效地資源調度,從而提高網絡的使用效率,更好地服務於用戶。網絡管理和維護就是準確理解網絡需求,進行最優化的網絡設計及部署;並能夠實時感知網絡狀況,及時排除故障。而人工智能會使得未來的通信網絡越來越不需要人,整個網絡的控制基本是全自動的,只需要很少的專家參與就可以把整個通信網絡的事情全部搞定。

2、醫療領域

李彥宏在介紹百度人工智能在醫療領域的應用時,提到四個層次,分別是O2O服務、智能問診、基因分析與精準醫療、新葯研發

  • 第一個層次:百度醫生現在已經有50萬的醫生參與諮詢,累計有800萬人通過百度醫生平臺來獲得相關的醫療服務。

  • 第二個層次:在智能問診的小測試中,百度醫生的診斷和北大國際醫院的醫生診斷,在80%的情況下是一致的,而且它可能在一些比較罕見的情況下表現更好。當然這些技術除了對大量的醫療知識進行機器學習外,也需要對病人表述的理解能力不斷地提升。

  • 第三個層次:用基因來進行治病,最大的一個問題是大多數已知的基因導致的疾病都是單基因導致的,而這些病又大多是罕見病,大多常見病是多基因導致的。通過大量的計算,人工智能可以幫助醫生搞清楚一個病是由哪些基因共同作用導致的。

  • 第四個層次:今天已知的、有可能形成藥的小分子化合物大概是10的33次方那麼多,這可能比全宇宙所有的原子加起來還要多。這樣的一個量,怎樣用它的分子式跟產生疾病的蛋白去合在一起,用來治病?怎樣對未知的那些分子式進行大量的篩選,找到有效的新葯?計算機科學、人工智能能夠在這方面有所幫助。

3、教育領域

教育行業其實是一個試錯成本非常高的行業,誰也不會拿孩子的成績來做實驗。醫療行業同樣如此,的確人工智能可以在圖像識別及診斷分析上給出建議,不過一旦出現醫療糾紛或因此而耽誤了病人的病情,責任由誰來承擔。

另一個方面,這兩個行業決策鏈條很長。它涉及的利益方很多,教育行業有學校、老師、家長、學生,在醫療行業就是醫院、醫生、病人。同時,這兩個行業又是國家相對高度管制的行業。

德聯資本合夥人賈靜表示,無論教育及醫療這兩個行業有多少困難,資本還是非常關注。因爲爲教育及健康買單的用戶,付費意願及能力都非常強。這條路雖然曲折,但前途特別光明。

實際上,教育行業要比醫療行業走得更靠前一些。目前在教育行業,已經有許多人工智能技術應用。比如人工智能深度參與到教、學、練、測、評的環節中,加快個性化教學的進程。但這需要積累大量真實有效的數據,誰能在整個教育環節積累到足夠多的數據就有可能跑到前面。

另一方面,教育行業一直想解決的問題是如何在供給側做到規模又經濟,老師該怎麼培訓和管理。那麼人工智能介入教育行業,以前由老師來解決的問題,可能70%-80%由人工智能來解決。這就從生產成本上進行了改革,根本上解決了生產資料和勞動力的分配問題,而不只是交易成本最小化。所以人工智能帶給行業的變革,要比移動互聯網大得多。

4、To C應用

幾年前出來的一些人工智能公司,技術發展已經相對成熟,比如科大訊飛,當年剛出來做的產品並不是那麼流暢,但現在做得已經不錯了。所以,技術差別不大的情況下,想要從技術上突破還是比較困難的,那就需要找到一個能夠激發用戶極致體驗的點,看用戶的體驗是不是超過了用戶對產品的期待。

比如做語音命令,亞馬遜Echo的一系列產品,拿到中國後就變成了純音響,用戶覺得這和漫步者差不多,它產生不了「哇」的這種感受,沒有這些感受就沒有辦法轉換成購買。一旦歸類錯了,大家不會考慮花更多的錢來買一個同類的產品。

華創資本合夥人熊偉銘表示,在To C領域可以突破的將會是無人車,但會涉及到監管問題。政府是否允許無人車在公路上跑,出了事故是算機器的責任還是人的責任,人們會有一些常識性的擔心。人類出於本能,對同類的信心要遠遠超出那些我們不瞭解其原理的事物。比如在醫療領域,雖然醫生資源十分短缺,但依然不會允許機器給人看病。沒有數據能證明機器的誤診率和醫生的誤診率是不一樣的,也阻礙了它進一步的發展及商用化。

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

1896年1月20日,一名叫沃爾塔·阿諾爾德的英國人因違反限速規定而被處以罰款,成爲世界上第一個因超速而被罰的汽車司機。當時他的車速只有13公里/時。到1896年「紅旗法」被廢止之前,英國對汽車的研製幾乎處於停滯狀態,在英國汽車發展史上留下了可悲的一頁。

這個鴻溝不是不可能逾越,而是需要很長的週期。就像汽車確實比馬車更先進,但也經歷了1865年英國議會針對蒸汽汽車制訂的「紅旗法案」這種看起來很荒唐的階段,而未來無人車可能要經歷一樣的道路。這其中,除了信心,制度監管要佔60%的因素。比如現在是不允許無人車在公路上運行,無論這輛無人車做了多少實驗,類似醫療領域,數據不能出醫院這一類法規還是大量存在。

如果無人車這麼難的事都實現了,可能包括看病或者政府的行政事務會慢慢放開。創業者要找一個行政環節最弱的點先切入,慢慢到一些行政壁壘很高的市場中去。

熊偉銘是也最早看移動互聯網領域的投資人之一,他說:「現在無人車的發展已經非常了不起了,這可能還只是一個小開始,但它發展到中期可能已經超過了移動互聯網的小高峯。」雖然人工智能大潮可能不會像移動互聯網這麼密集地爆發,但會比移動互聯網持續時間更長,一波接一波,發展到最後,這個領域會有巨大的成長和收穫。

在此他也給創業者提出建議,無論創業者進入到To B還是To C的領域都要選好市場及切入點,因爲在機器學習上,它解決的是提高內部效率的問題。「你會活得更好一點,但這並不能改變你所從事的行業或領域的市場大小。原來需要100個人乾的事現在只需要10個人,但是一個公司能解決1000人的問題,那你加上人工智能的技術也只能解決那1000人的問題,只不過原來能賺10元,現在能賺100元。」

三、人工智能面臨的五大考驗

在這場討論中,我們還得出以下結論:目前人工智能雖處於寒武紀的大爆發階段,但也很可能再度面臨寒潮。具體來說,人工智能可能會面臨這五大考驗:

  • 第一大考驗:理論鴻溝很難逾越。

目前人工智能在學習上遵循的理論依然是上個世紀80年代提出的,人們並沒有從本質上理解人類的學習原理,從監督學習到無監督學習的方法還在探索。如果將人工智能比作建造太空火箭,計算能力和數據是燃料,理論就是發動機。如果你有許多燃料但只擁有小功率發動機,你的火箭大概無法飛離地面。如果你擁有大功率發動機但只有一點點燃料,你的火箭即使飛上天也無法進入軌道。

目前的人工智能技術多數都要依靠形態匹配,在監督式學習下,輸入訓練數據,每組訓練數據有一個明確的標識或結果。人們將預測結果與「訓練數據」的實際結果進行比較,不斷調整預測模型,直到模型的預測結果達到一個預期的準確率。

而無監督學習中,計算機無需人類幫助的情況下,像人類一樣自己學習知識。計算機並不被告知怎麼做,而是採用一定的激勵制度來訓練機器人培養出正確的分類。無監督學習方式是機器人工智能發展的關鍵技能之一。「目前朝着良性的趨勢發展,但還未達到我們希望的階段。」微軟亞洲研究院院長芮勇表示。

  • 第二大考驗:知識表達問題。

許多輸入的數據其實都經過了人腦抽象,但大家看不到,就好比你看到地面上的竹子每一根都是獨立的,但它的地下莖聯繫是非常緊密的。若要完成形式化知識結構的搭建,是需要很多知識的,而機器中沒有人腦中的背景知識,所以數據中蘊含的信息是不完整的,繼而計算不出正確的結果。

如果將這些信息補足,是有可能用機器處理的。但同時要看到的是這些信息很難補足,一方面是因爲很多人腦中的知識難以形式化,另一方面,補什麼補多少才能達到特定的效果,很難衡量。並且人腦輸出的信息帶寬太小,很難通過一個人來補足機器中沒有的知識,而多人協同又存在知識相互不兼容的問題。所以知識太多,知識難以形式化,人腦輸出太慢,成爲了知識表達的三大障礙

海雲數據的首席數據科學家趙丹表示,目前大公司基本上通過知識圖譜來解決知識表達的問題,但這不是根本的解決方法。知識圖譜雖然能在小的特定領域解決一部分數據稀疏問題,但圖譜本身也有稀疏的問題,並且依賴人工構建,規模有限。遷移學習也能夠發揮一定作用,但目前還沒有把這些解決技術整合起來,形成一個完整的智能體系的理論架構。

同時趙丹還認爲,深度學習的研究一定程度上已經到達瓶頸期,現在到了需要將深度學習現有的成果轉化成產品的時候,比如Deepmind前段時間發佈的脣語識別成果,再往前比如AlphaGo的博弈策略學習。「而形成產品是件很難的事情,像我們熟知的人臉識別,雖然已有不少創業公司做了好幾年,但現在仍然沒有生產出成熟的產品。工程上的坑不比研究上的少,如若跨不過去就沒有辦法做出產品。」

在科學理論上的進步很多是偶然事件,說不準下次會是什麼時候。深度學習的成果轉換期,到下次深度學習的進步期之間其實還是會有可能出現寒潮。

  • 第三大考驗:人才問題。

圖像識別方面的成就像一把發令槍,啓動了一場人才爭奪賽。有人曾說:「這個領域的人才戰相當血腥,一流的人才就像NFL足球運動員。」

谷歌在 2011年推出專注深度學習的谷歌大腦計劃(Google Brain Project),2013年3月得到了神經網絡先驅Geoffrey Hinton的加入,現在有超過1000個深度學習項目。

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

Yann LeCun,現任Facebook人工智能研究部門主管。

Facebook在2013年12月聘請了法國神經網絡創新者Yann LeCun作爲它的新AI實驗室的帶頭人。平均每天使用神經網絡翻譯來自超過40種語言國家的20億用戶的帖子,這些翻譯的內容每天被8000萬用戶閱讀。

百度在2014年4月聘請了谷歌腦計劃的前負責人吳恩達作爲它的人工智能實驗室的領頭人,主攻語音識別等關鍵領域。

但蔣濤指出:現在人工智能領域的理論掌握在頂尖教授手上,但應用的數據在公司手上。頂尖教授一般會有與同行進行交流、發表研究成果的訴求,但公司的研發卻要求不能透露商業核心祕密,甚至要將這個科學家雪藏起來,比如蘋果現在人工智能的領導者是誰,我們都還不知道。這裏面存在天然的衝突,很可能成爲制約人工智能發展的瓶頸。

  • 第四大考驗:資本化問題。

由於人工智能是巨頭公司的天下,所以「被併購」是許多初創公司的宿命。當前,谷歌、IBM、雅虎、英特爾、蘋果、Salesforce以及國內的百度、阿里等互聯網科技巨頭公司佈局勢頭「兇猛」,引發了一場全球範圍內的人工智能投資收購熱潮。

根據風投數據公司CB Insights的統計數據顯示,2011年起,拿到融資的人工智能創業公司裏面有近一半(140家)都被收購了,其中2016年就有40家。主力買主是谷歌、Twitter、IBM、雅虎、英特爾和蘋果,谷歌以11次收購的成績位列榜首。

然而,一些巨頭公司在併購人工智能初創公司的時候卻面臨着重重問題。專注於大數據人工智能領域投資併購的前海梧桐併購母基金總經理馬春峯道出了自己看法:

首先,反觀目前國內人工智能企業估值偏高,僅有2~3人的早期初創公司有時開價達1~2億元,較成熟公司的估值甚至比上市公司還高。這種高估值企業有時甚至讓產業投資者難以接受,結果導致某些上市公司和產業基金紛紛出海,佈局硅谷、以色列等海外市場。

不過,上市公司或產業基金佈局海外市場都需要考慮落地問題,這時候溝通成本、管理成本、人員適應本地化成本便會增加。因此,如何降低成本成爲佈局海外市場的一大難題

其次,上市公司在投資初創企業時多對其業績有要求,這就使得它們在投資併購時傾向於選擇較爲成熟的AI公司。然而目前國內人工智能領域的創業公司在整體效果上並沒有達到上市公司的期望值,許多初創公司的成熟度與上市公司自身業務發展的匹配度也不夠高。

所以,現在多數上市公司採取的方式是先在體外投資孵化,待孵化的公司成熟到一定程度時再裝進上市公司內部。

另外,有些上市公司自身也存在追逐熱點的問題,在並不具備佈局大數據、人工智能產業的基因的情況下,但卻在積極佈局。這使得被投資或併購來的公司不能匹配上市公司的業務、管理能力和戰略發展方向,反而導致初創公司的未來發展受到了限制。

  • 第五大考驗:安全問題。

這裏面的安全不是某一項人工智能產品是否存在風險,而是對強人工智能何時出現的整體的考量。

其中,比較極端的觀點來自於未來學家雷·庫茲韋爾(Ray Kurzweil ),他提出摩爾定律的擴展定理,認爲很多技術處於指數增長中;後來又發表奇點理論,預測技術在突破一個稱之爲奇點的臨界點後將實現爆發性增長,在2045年左右會出現自己思考的人工智能。

當然,在大多數行業專家看來這是個僞命題。吳恩達表示「人工智能毀滅人類論」就是炒作,目前我們的科技還停留在弱人工智能階段,強人工智能目只存在於科幻片。

對於人工智能的安全性,扎克伯格的觀點代表了中國創投界大多數的想法:我們過度擔憂人工智能,將阻礙人工智能實際的進步。現在擔憂人工智能的安全性,就如同兩百年前擔心要是以後有飛機了飛機墜毀怎麼辦一樣。我們要先造出飛機,再擔心飛機的安全性。

雷鋒網(公衆號:雷鋒網)注:本文由人人都是產品經理社區作者@投資人說(ID:touzirenshuo)原創發佈。未經許可,不得轉載。

2016年人工智能領域的總結與思考:未來將面臨的五大考驗

文章來源:雷鋒網