英偉達剛剛發佈全球最大GPU:GTC2018黃仁勳演講核心內容都在這

 2018-03-28 12:00:56.0

正如黃仁勳所說的,今天的發佈會有關於:「Amazing science, amazing graphics, amazing products and amazing AI.」

核心內容:

  • 新一代服務器級 GPU:搭載英偉達 RTX 技術的 GPU Quadro GV100,以及「世界最大的 GPU」

  • NVIDIA AI 平臺:TensorRT 4 等技術,多種重大改進

  • 推出 DRIVE Constellation 自動駕駛仿真系統

圖注:黃仁勳 Keynote 演講總結

搭載英偉達 RTX 技術的 GPU Quadro GV100

在今天的 GTC 大會 Keynote 中,黃仁勳首先宣佈推出搭載 NVIDIA RTX 技術的 Quadro GV100 GPU,首次向數以百萬計的藝術家和設計師提供實時光線追蹤技術。

黃仁勳表示,結合強大的 Quadro GV100 GPU,NVIDIA RTX 能夠在運行專業設計及內容創作類應用程序的同時,實現實時的計算密集型光線追蹤。

Quadro GV100 具有 32GB 內存,且可藉助 NVIDIA NVLink 2 互聯技術,通過並聯兩塊 Quadro GPU 擴展至 64GB,在所有適用於此類應用的平臺中其性能最高。

在性能方面,GV100 基於 NVIDIA Volta GPU 架構,可提供每秒 7.4 萬億次浮點運算的雙精度性能、每秒 14.8 萬億次浮點運算的單精度性能、以及每秒 118.5 萬億次浮點運算的深度學習性能。NVIDIA RTX 內置的 NVIDIA OptiX AI-denoiser 可實現實時的 AI 去噪,英偉達表示且其性能相當於採用 CPU 時的 100 倍。

NVIDIA AI 平臺:多項重大改進

而後,如同往屆,黃仁勳對英偉達 AI 平臺做了介紹,公佈了其中的一系列重要進展,包括全新 Tesla V100 32GB GPU 的 2 倍內存、革命性的 NVSwitch 結構、以及全面的軟件堆棧推動性能提升、深度學習工作站 DGX-2 成爲首款性能高達每秒 2 千萬億次浮點運算的深度學習系統、發佈深度學習引擎 TensorRT 4 等。英偉達表示,相較於六個月前發佈的上一代產品 DGX-1,其深度學習工作負載性能實現了 10 倍提升。

在大會上,黃仁勳宣佈,新版的 Tesla V100 內存擴容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黃仁勳說道,「它有 8 層,數百個參數。而今天我們能夠看到數百層的神經網絡,內含數十億參數,深度學習模型經過五年的發展,體量擴大了 500 倍。」

而這樣的計算需求可由「世界上最大的 GPU」DGX-2 進行處理,它是由 16 塊 32GB 內存的 Tesla V100 計算卡通過 NVSwitch 進行連接(顯卡間的通信速度是 PCI 的 20 倍,每秒 300Gbyte)所組成的,共擁有 2000TFPLOS 的 Tensor Core 算力,售價 39.9 萬美元。NVSwitch 是今天黃仁勳宣佈的全新的 GPU 互聯結構。

DGX-2 是首款能夠提供每秒兩千萬億次浮點運算能力的單點服務器,具有 300 臺服務器的深度學習處理能力,佔用 15 個數據中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。

而後,黃仁勳宣佈了英偉達在 AI 推理上的一系列動作。黃仁勳表示,基於在數據中心、汽車應 用、以及包括機器人和無人機等嵌入式設備領域中,諸如語音識別、自然語言處理、推薦系統、 以及圖像識別等新功能的支持,面向深度學習推理的 GPU 加速正在獲得越來越多的關注。

「我們需要超級計算機來幫助自己尋找更高效的能源存儲方法,探索地球的內部,預測未來的自然災害,以及模擬微觀世界的變化。」黃仁勳說道。

英偉達宣佈推出新版 TensorRT 推理軟件 TensorRT 4,並將 TensorRT 集成至谷歌的 TensorFlow 框架。

英偉達表示,TensorRT 4 可用於快速優化、驗證及部署在超大規模數據中心、嵌入式與汽車 GPU 平臺中經過 訓練的神經網絡。相比 CPU,針對計算機視覺、神經網絡機器翻譯、自動語音識別、語音合成 與推薦系統等常見應用,該軟件最高可將深度學習推理的速度加快 190 倍。而且爲了進一步精簡開發,英偉達與谷歌的工程師已將 TensorRT 集成至 TensorFlow 1.7,使得在 GPU 上運行深度學習推理應用更加容易。

此外,英偉達還宣佈了面向 Kubernetes 的 GPU 加速,以促進企業在多雲 GPU 集羣上的推理部署。英偉達將針對開源社羣強化 GPU 性能,以支持 Kubernetes 生態系統。

推出 DRIVE Constellation 仿真系統

自動駕駛一直是 GTC 大會的重要部分,今天,英偉達展示了一套用於使用照片級真實感模擬,基於雲的自動駕駛汽車測試系統。

該系統被稱爲 NVIDIA DRIVE Constellation,是一種基於兩種不同服務器的計算平臺。第一臺服務器運行 NVIDIA DRIVE Sim 軟件,用以模擬自動駕駛汽車的傳感器,如攝像頭、激光雷達和雷達。第二臺服務器搭載了 NVIDIA DRIVE Pegasus AI 汽車計算平臺,可運行完整的自動駕駛汽車軟件堆棧,並能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的傳感器。

要實現自動駕駛汽車的量產部署,我們需要一種能夠在數十億英里的行駛中進行測試和驗證的解決方案,以實現足夠安全性和可靠性。黃仁勳介紹說,DRIVE Constellation 可以將視覺計算和數據中心方面的專業知識相結合以實現這一目標。藉助虛擬現實技術,測試者可通過對數十億英里的自定義場景和極端情況進行測試,從而提高算法的穩定性,而花費的時間和成本僅爲實際道路測試的一小部分。

此外,英偉達還推出了機器人開發平臺 ISSAC 等工具。同時宣佈與 ARM 展開合作。兩家公司正在合作將開源的 NVIDIA 深度學習加速器 NVDLA 架構集成到 Arm 的 Project Trillium 平臺上,以實現機器學習。此次合作將使物聯網芯片公司能夠輕鬆地將 AI 集成到自己的設計中,並幫助它們將智能化且價格低廉的新產品帶給全球數十億的消費者。

小結

英偉達 GTC 大會從 2009 年開辦以來,越來越受到人們的關注。而隨着人工智能的火熱,GPU 價值也水漲船高。而本屆 GTC 相比於第一屆,參會人數增加了近 10 倍,火熱程度也超乎以往。但遺憾的是,今天的發佈仍然圍繞商用計算設備進行,不像國內外衆多媒體猜測的那樣會發布新一代 Geforce 顯卡。或許,衆多玩家還要繼續等待一段時間。

文章來源:機器之心