19.9萬美元!NVIDIA發布安培個人超算:八路GPU、雙路AMD 64核心

 2020-05-15

5月14日晚間,NVIDIA終於發布了期待已久的全新“安培”(Ampere)架構,又一個核彈級的GPU芯片,當然它面向的不是PC遊戲市場,而是人工智能、深度學習、高性能計算、大數據等等尖端領域。


宣布新架構的同時,NVIDIA也發布了相應的第三代伺服器“DGX A100”,或者按照NVIDIA的說法叫做個人超級計算機,可以支持在桌面端進行AI研究,並擴展到雲端。







DGX A100內部配備了八顆安培架構的Tesla A100 GPU,每一顆整合40GB HBM2高帶寬顯存,總容量達320GB。


每顆GPU均支持多達 12路的NVLink互連總線,GPU-GPU帶寬 高達600GB/s,可保證八顆GPU彼此完全互連,同時還有6顆NVIDIA NVSwitch芯片, 雙向帶寬高達4.8TB/s


不過從示意圖上可以看出,每顆GPU周圍其實有六顆HBM2顯存芯片,很顯然有一顆沒有啟用,剩下的五顆單顆容量8GB從而組成40GB。這意味著,A100核心現在應該也是屏蔽了六分之一的規模。







網絡方面配備了剛完成收購的Mellanox的解決方案,包括 八顆單端口ConnectX-6 VPI用於聚類,峰值性能200GB/s,以及一顆雙端口ConnectX-6 VPI用於數據與存儲網絡。



有趣的是,搭配的CPU處理器這次拋棄了Intel至強,改而使用兩顆AMD二代霄龍(Rome),且是頂級的64核心型號,同時搭配1TB DDR4內存、15TB PCIe 4.0 NVMe SSD固態硬盤。




黃仁勳稱這是“世界上最大的顯卡”,不算外殼單單是其中的計算板加散熱器就有45斤的重量,集成超過3萬個不同組件,鑽孔數量多達100萬個,連接電路長達1公里。





NVIDIA宣稱,DGX A100系統單節點的峰值性能為:INT8 10 PetaOPS(每秒1億億次整數運算)、FP16 5 PFlops(每秒5千萬億次半精度浮點運算)、TF32 2.5 PFlops(每秒2.5千萬億次運算)、FP64 156 TFlops(每秒156萬億次雙精度浮點運算)。


相比於高端CPU服務器,它的AI計算性能要高出150倍,內存帶寬高出40倍,IO帶寬也高出40倍。






NVIDIA DGX A100個人超算現已上市,售價19.9萬美元,約合人民幣141萬元。


該方案的雲服務客戶有阿里雲、亞馬遜AWS、百度雲、Google Cloud、微軟Azure、甲骨文、騰訊雲,系統級客戶有AtoS、Cray、戴爾、富士通、技嘉、HPE、浪潮、聯想、廣達、 SuperMicro。






























文章來源:快科技