Tesla V100 Tesla P100 GTX 1080 ti Pascal 比較

 2017-09-08 16:46:57.0

TitanXp
Pascal
TitanX
Pascal
GTX 1080 ti
Pascal
GTX 1080
Pascal
GPU GP102-450 GP102 GP102 GP104
CUDA Cores  3840 3584 3584 2560
Boost Clock  1582 MHz 1531 MHz 1582 MHz 1733 MHz
FP64  0.37 TFLOPS 0.34 TFLOPS 0.35 TFLOPS 0.28 TFLOPS
FP32  12.1 TFLOPS 10.97 TFLOPS 11.3 TFLOPS 8.87 TFLOPS
Mem Clock  11.4 Gbps 10 Gbps 11 Gbps 10 Gbps
Mem Bus Width  384 bit 384 bit 352 bit 256 bit
Mem Band Width  547.7 GB/s 480 GB/s 484 GB/s 320 GB/s
VRAM  12 GB 12 GB 11 GB 8 GB
TDP  250 W 250 W 250 W 180 W
LINK WEB WEB  WEB Whitepaper
Price(Amazon) $1200 20万円前後  10万円前後 10万円前後

Voltaの情報が出てきたので追記しました。

Tesla V100
(NVLINK)
Tesla V100
(PCIe)
Tesla P100
(NVLINK)
Tesla P100
(PCIe)
Tesla P40 Tesla P4
GPU  GP100  GP100  GP102  GP104
Cores  5120  5120  3584  3584 3840 2560
Boost Clock  1462 MHz  1480 MHz  1328 MHz  1531 MHz  1063 MHz
FP64  7.48 TF  7 TF  5.30 TF  4.76 TF  0.37 TF  0.17 TF
FP32  14.9TF  14 TF  10.61 TF  9.52 TF*  11.76 TF  5.44 TF
FP16  21.22 TF  19.04 TF
INT8  47 TOPS  22 TOPS
Mem  HBM2  HBM2  HBM2  HBM2 GDDR5 GDDR5
Mem Clock 1.43 Gbps 1.43 Gbps 7.23 Gbps 6 Gbps
Mem Bus Width  4096bit  4096bit 4096 bit 4096 bit 384 bit 256 bit
Mem Band Width  900GB/s  900GB/s 732 GB/s 732 GB/s 347 GB/s 192 GB/s
VRAM  16GB  16GB 16GB  16GB  24GB  8GB
TDP  300W  250W  300 W 250 W 250 W  75 W
LINK  WhitePaper  Whtepaper  Product Brief Product Brief  WEB
Price(Amazon) 70万円前後?

*3584cores x 1328 MHz x2 = 9.519になるのだが、公式ページでは9.3TFになっている。

*3584cores x 1328 MHz x2 = 9.519になるのだが、公式ページでは9.3TFになっている。


GP100は歩留まりの関係で60個のSM(Streaming Multiprocessor:1SM=64cores)中、4個が無効にされているみたい(参考:後藤弘茂さんのWeekly海外ニュース)なんですが、PCIe版は実は5個向こうになっているとか?

詳しい人いたら教えてください。


3584cores x 1.3 GHz x2 = 9.3が濃厚。。




文章來源:CM