黃仁勳的「廚房演講」,熬製的卻是英偉達 GPU 史上最大性能飛躍

 2020-05-15 08:48:51.0

編者按:本文來自微信公衆號「極客公園」(ID:geekpark),作者:王訓魁,36氪經授權發佈。

第一次,在自家的廚房裏,英偉達創始人兼 CEO 黃仁勳開始了 GTC 2020 的演講。

「未來十年,數據中心的規模計算將成爲標準。」說完,老黃從自家的烤箱裏拿出了全新的安培(Ampere)架構 GPU,7nm 工藝,540 億晶體管,20 倍 AI 算力的提升。

每次帶來全新架構,都必然是一次「性能躍遷」。只是這次它不是開啓了一個全新的大門,而是作爲最後一塊磚,補齊了英偉達在數據科學與 AI 應用上的完整版圖。

去年的 GTC2019,黃教主罕見的沒有放出「重磅核彈」傳言中的下一代 7nm 產品以及新架構也並沒有出現,而更加強調「生態」優勢與「落地」的英偉達卻彷彿要從側翼用「軟件生態」構築起一道護城河。

在高性能計算之下,收購「絕配」的高性能網絡公司 Mellanox 和 Cumulus Networks,藉助這兩個公司組成的新業務部門,老黃開始逐漸加深其在數據中心領域的強勁增長。

而現在,依靠這次帶來的新的 Ampere 圖形架構,在 AI 計算、數據中心等領域上讓英偉達獲得了全面的「能力升級」。

黃仁勳的「廚房演講」|英偉達官方

英偉達之前的成長很大程度上是依靠其遊戲 GPU 處理器。如今,英偉達逐漸開始在衆多人工智能 AI 應用程序方面顯現巨大的增長潛力。英偉達在 AI 領域的處理器,可以幫助提高 AI 語意理解能力,優化搜索引擎建議,甚至賦能公共雲以及物流,零售和倉儲等垂直行業。

在疫情期間,這些行業和應用成爲「必需品」。巨大的推動力也爲英偉達的收入和收益帶來了高於平均水平的增長。更重要的是,這也讓英偉達擺脫了短期加密貨幣的動盪影響,轉身跨入了一個新的增長時代。

全面投產的新「核彈基地」

老黃今天宣佈,基於 NVIDIA Ampere 架構的首個 GPU,即 NVIDIA A100,正在全面生產並向全球客戶發貨。

再說 NVIDIA A100 是「核彈」並不嚴謹,它更像是一個「核彈基地」。A100 利用了英偉達安培架構的設計突破,在其 8 代 GPU 中提供英偉達迄今爲止最大的性能飛躍,將性能提高到其前輩的 20 倍。

NVIDIA A100 GPU|英偉達官方

同時,它是一個端到端機器學習加速器——從數據分析到訓練再到推理。第一次在一個平臺上來統一人工智能訓練和推理。A100 是一個通用的工作負載加速器,它也是爲數據分析、科學計算和雲圖形設計的。

「雲計算和人工智能的強大趨勢正在推動數據中心設計的結構性轉變」黃仁勳說,「過去純 CPU 服務器的海洋,正在被 GPU 主導的加速計算基礎架構所取代。」

黃仁勳說,買得越多,省得越多。(Buy more GPUs , the more money you save.)|官方 Keynote

而貫徹「買更多,省更多」的宗旨,NVIDIA A100 將同時提高吞吐量並降低數據中心的成本。

A100 內置了新的彈性計算技術,可「靈活拆分」計算能力。多實例 GPU 能力允許每個 A100 GPU 被分割成多達七個獨立的實例來推斷任務,而第三代 NVIDIA NVLink interconnect 技術允許多個 A100 GPU 作爲一個巨型 GPU 運行,以完成更大的訓練任務。

第一批利用 NVIDIA A100 GPU 的是微軟,它將利用 NVIDIA A100 的來訓練圖靈自然語言生成,這個世界上最大的語言模型。疫情期間,這也讓外賣巨頭 DoorDash 獲得了更強的能力,「這有助於減少模型訓練時間,加快機器學習的開發過程。」DoorDash 的機器學習工程師 Gary Ren 說。早期採用者還包括國家實驗室和一些世界領先的高等教育和研究機構。

NVIDIA A100 很快就會進入雲計算。包括 BAT 在內的雲業務,字節跳動、谷歌雲、亞馬遜雲 (AWS) 等幾乎主流大廠都將在產品中加入 A100 GPU。

當然關於 NVIDIA A100 GPU,英偉達認爲這是一項「技術設計突破」,英偉達自己總結了五個關鍵創新推動:

●NVIDIA 全新安培 Ampere 架構——A100 的核心是 NVIDIA Ampere GPU 架構,它包含超過 540 億個晶體管,使其成爲世界上最大的 7 納米處理器。

● 使用第三代 Tensor Core AI 核心,現在更加靈活、更快、更容易使用。他們的擴展功能包括新的人工智能 TF32,它允許高達 20 倍的 FP32 精度的人工智能性能,沒有任何代碼更改。此外現在支持 FP64,爲 HPC 應用提供了比上一代多 2.5 倍的計算能力。

● 多實例 GPU (Multi-instance GPU)——MIG,一個新的技術特性,可以將一個 A100 GPU 分割成多達 7 個單獨的 GPU,這樣它就可以爲不同大小的任務提供不同程度的計算,提供最優的利用率和最大的投資回報。

● 第三代 NVIDIA NVLink——使 GPU 之間的高速連接加倍,從而在服務器上提供高效的性能擴展。

● 結構稀疏性——這種新的效率技術利用了人工智能數學固有的稀疏性,使性能提高了一倍。

NVIDIA A100 | 英偉達官方

總之,這些新特性使 NVIDIA A100 成爲多樣化、高要求工作負載的理想選擇,包括人工智能培訓和推理以及科學模擬、會話人工智能、推薦系統、基因組學、高性能數據分析、地震建模和財務預測。

今天英偉達也開始與開源社區合作,將端到端 GPU 加速引入 Apache Spark 3.0,這是一個用於大數據處理的分析引擎,全世界有 50 多萬數據科學家使用它。NVIDIA 的企業計算主管 Manuvir Das 說:「數據分析是當今企業和研究人員面臨的最大的高性能計算挑戰。」「從 ETL 到訓練再到推理,整個 Spark 3.0 的 GPU 加速提供了最終連接大數據潛力和人工智能能力所需的性能和規模。」Adobe 是首批在 Databricks 上運行 Spark 3.0 預覽版的公司之一。在最初的測試中,它的性能提高了 7 倍,節省了 90% 的成本。它使用 GPU 加速數據分析,用於 Adobe 體驗雲中的產品開發,並支持支持數字業務的功能。

從「新玩家」到寶馬工廠,汽車行業的全面「滲透」

NVIDIA DRIVE AGX 正爲汽車行業初創公司提供 AI 驅動力。

在 GTC Digital 期間,電動汽車和自動駕駛汽車初創公司小馬智行(Pony.ai)、Canoo 和法拉第未來(Faraday Future)紛紛宣佈藉助 NVIDIA DRIVE AGX 計算平臺開發汽車。這個高性能、高能效的平臺可實現跨級別的自動駕駛,幫助企業進行可靠的軟件定義車輛開發。

這幾家公司全都加入了一個廣泛的全球生態系統。該系統中的汽車製造商、一級供應商、卡車製造商、傳感器供應商、Robotaxi 公司和軟件初創公司均在 NVIDIA DRIVE 上進行開發。

自動駕駛技術公司小馬智行正在 NVIDIA DRIVE AGX Pegasus 上開發其新一代 Robotaxi 車隊。自 2018 年以來,該公司一直在加利福尼亞州和中國測試自動駕駛車輛的叫車服務。今年 4 月,小馬智行開始在加利福尼亞州爾灣市提供自動派送服務,幫助因新冠疫情影響而在該地區隔離的人。

藉助 DRIVE AGX Pegasus 自動駕駛平臺來滿足 Robotaxi 上市所需的海量計算需求。Pegasus 計算平臺可實現每秒 320 萬億次(TOPS)深度學習運算,內置兩個 NVIDIA Xavier 處理器和兩塊 NVIDIA Turing Tensor Core GPU。

電動汽車初創公司 Canoo 推出了一款時尚的電動汽車,這款汽車的風格類似於大衆經典車型 Microbus 的未來風格。這款專用於共享出行服務的汽車將於 2021 年下半年投入生產。

Canoo 汽車將配備 NVIDIA DRIVE AGX Xavier 驅動的 AI 輔助駕駛功能。該計算平臺具有 30 TOPS 物體探測和傳感器融合性能,能夠運行構建十字路口警報、盲點探測和行人探測功能的先進算法,以及自適應巡航控制和車道偏離預防等便捷功能。

軟件定義的 DRIVE AGX Xavier 還能引入更多市面上推出的高級功能,例如自動車道變換、交通信號識別和規避轉向等。

小鵬最新推出的 P7 的 XPILOT3.0 就是使用了英偉達 DRIVETM AGX Xavier 平臺。目前,小鵬還宣佈將在下一代生產車型中利用 DRIVE 平臺,小鵬自動駕駛副總裁吳新宙博士說,「我們非常高興能在下一代電動汽車生產模式上擴大與 NIVIDA 的合作。」

就連許久未發聲的新造車鼻祖法拉第未來(Faraday Future)也宣佈將在其旗艦豪華 FF 91 電動車上部署 NVIDIA DRIVE AGX Xavier 平臺,開發新一代 FF91。根據 FF 的新計劃,FF 91 將在成功完成股權融資約 9 個月後開始交付。最新發布的 FF 81 EV 還將配備 DRIVE AGX Xavier,以及未來的型號和下一代核心技術。

寶馬集團也在今天宣佈,公司已經選擇了新的 NVIDIA Isaac 機器人平臺來加強其汽車工廠——利用建立在先進的人工智能計算和可視化技術上的物流機器人。

「利用人工智能和機器人技術上的突破,創造出可高度定製、準時化、順序化的下一代生產模式。」老黃說。

寶馬集團負責物流的高級副總裁 Jürgen Maidl 說:「最終,大量可能的配置成爲了寶馬集團在三個基本領域的挑戰——計算、物流規劃和數據分析,」寶馬集團 (BMW Group) 的供應鏈需要從 4500 多個供應商站點向工廠輸送數百萬件零部件,涉及 23 萬個獨特的零部件編號。目前,寶馬銷售的車輛平均有 100 種不同的選擇,導致 99% 的客戶訂單彼此之間存在獨特的差異。這給工廠物流帶來了巨大的挑戰。

合作的核心是實現一個基於英偉達技術的端到端系統——從培訓和測試到部署——使用一種軟件架構開發的機器人,運行在英偉達的開放 Isaac 機器人平臺上。寶馬集團的目標是提高物流工廠的流程,以生產定製配置的汽車更迅速和更有效。一旦開發完成,該系統將部署到寶馬集團的全球工廠。

英偉達的增長源泉

黃仁勳一直說,人工智能是未來增長的巨大潛在驅動力。

第一個驅動因素是「推理」的概念。推理,也稱爲推理引擎,將邏輯規則應用於知識庫以形成新信息。例如,可以利用客戶購買歷史、興趣以及他們的位置等事實來確定針對性的營銷計劃。

而人工智能增長的第二個推動力是實現突破的模型算法能力。英偉達的產品具有低延遲性能,而 AI 應用程序例如語言識別/理解程序和互聯網搜索推薦系統,這些系統現在正在使用深度學習。

第三個驅動力是公共雲的增長。公共雲的增長來自許多在雲中開發 AI 軟件的 AI 初創公司。黃仁勳(Jensen Huang)表示,人工智能初創企業數量達數千家。由於公共雲可以支持規模較小且剛剛起步的公司,因此易於使用。

人工智能的第四增長動力是垂直行業。這包括物流,零售和倉儲。沃爾瑪(WMT),美國郵政(USPS)和美國運通(AXP)等公司/組織擁有大量需要分析/預測分析的數據。

同時,這一領域還需要邊緣 AI 計算。這樣能保證進行實時操作,例如包括機器人、自動駕駛汽車的某些操作,數據創建以及需要在幾毫秒內發生的決策。

我們可能會更容易的從 AI 中看到現實世界的解決方案:增強的購物體驗(更好的庫存系統/更智能的佈局/更智能的結帳系統),增強的汽車自動駕駛視覺計算性能/解決方案,實時交通監控以確保更安全的道路,基因組計算,5G 加速等等。

這些各種行業中 AI 應用程序的增長空間可能會給英偉達帶來一個可以實現數年的持續增長的領域。Grand View Research 估計,到 2025 年,全球 AI 市場將以每年約 46% 的速度增長。

我們發現,英偉達不在是一個單純的 GPU 硬件公司,它正在成長爲一個「生態型」的基礎設施,跑在一個高速增長的時代下。

文章來源:36kr