19.9萬美元！NVIDIA發布安培個人超算：八路GPU、雙路AMD 64核心

2020-05-15 05:05:53.0

5月14日晚間，NVIDIA終於發布了期待已久的全新“安培”(Ampere)架構，又一個核彈級的GPU芯片，當然它面向的不是PC遊戲市場，而是人工智能、深度學習、高性能計算、大數據等等尖端領域。

宣布新架構的同時，NVIDIA也發布了相應的第三代伺服器“DGX A100”，或者按照NVIDIA的說法叫做個人超級計算機，可以支持在桌面端進行AI研究，並擴展到雲端。

DGX A100內部配備了八顆安培架構的Tesla A100 GPU，每一顆整合40GB HBM2高帶寬顯存，總容量達320GB。

每顆GPU均支持多達 12路的NVLink互連總線，GPU-GPU帶寬 高達600GB/s，可保證八顆GPU彼此完全互連，同時還有6顆NVIDIA NVSwitch芯片， 雙向帶寬高達4.8TB/s 。

不過從示意圖上可以看出，每顆GPU周圍其實有六顆HBM2顯存芯片，很顯然有一顆沒有啟用，剩下的五顆單顆容量8GB從而組成40GB。這意味著，A100核心現在應該也是屏蔽了六分之一的規模。

網絡方面配備了剛完成收購的Mellanox的解決方案，包括 八顆單端口ConnectX-6 VPI用於聚類，峰值性能200GB/s，以及一顆雙端口ConnectX-6 VPI用於數據與存儲網絡。

有趣的是，搭配的CPU處理器這次拋棄了Intel至強，改而使用兩顆AMD二代霄龍(Rome)，且是頂級的64核心型號，同時搭配1TB DDR4內存、15TB PCIe 4.0 NVMe SSD固態硬盤。

黃仁勳稱這是“世界上最大的顯卡”，不算外殼單單是其中的計算板加散熱器就有45斤的重量，集成超過3萬個不同組件，鑽孔數量多達100萬個，連接電路長達1公里。

NVIDIA宣稱，DGX A100系統單節點的峰值性能為：INT8 10 PetaOPS(每秒1億億次整數運算)、FP16 5 PFlops(每秒5千萬億次半精度浮點運算)、TF32 2.5 PFlops(每秒2.5千萬億次運算)、FP64 156 TFlops(每秒156萬億次雙精度浮點運算)。

相比於高端CPU服務器，它的AI計算性能要高出150倍，內存帶寬高出40倍，IO帶寬也高出40倍。

NVIDIA DGX A100個人超算現已上市，售價19.9萬美元，約合人民幣141萬元。

該方案的雲服務客戶有阿里雲、亞馬遜AWS、百度雲、Google Cloud、微軟Azure、甲骨文、騰訊雲，系統級客戶有AtoS、Cray、戴爾、富士通、技嘉、HPE、浪潮、聯想、廣達、 SuperMicro。

文章來源：快科技