GPU类型

  |   0 评论   |   0 浏览

  • V100是定位在绝对的性能要求比较高的场景,比如对训练端、学习端,对计算速度有绝对的要求,或是推理端,对推理有绝对的速度要求,再或者以单精度或双精度为主的绝对计算都有要求,这是V100的定位;
  • T4定位主要面向推理端,刚才我们看到有一个很好的性能提升,在75W功耗下,T4在计算性能上有两倍多的提升并且能耗不变,所以T4可以很好的用在其他场景做一些推理或入门级的训练,单精度要求的一些场景,或是渲染VDI都有不错的表现。

| 云服务器吧 | Tesla T4:世界领先的推理加速器 | Tesla V100:通用数据中心 GPU | 适用于超高效、外扩型服务器的 Tesla P4 | 适用于推理吞吐量服务器的 Tesla P40 |
| - | - | - | - | - |
| 单精度性能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) | 5.5 TFLOPS | 12 TFLOPS |
| 半精度性能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe) 125 TFLOPS (SXM2) | — | — |
| 整数运算能力 (INT8) | 130 TOPS | — | 22 TOPS* | 47 TOPS* |
| 整数运算能力 (INT4) | 260 TOPS | — | — | — |
| GPU 显存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
| 显存带宽 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
| 系统接口/外形规格 | PCI Express 半高外形 | PCI Express 双插槽全高外形 SXM2/NVLink | PCI Express 半高外形 | PCI Express 双插槽全高外形 |
| 功率 | 70 W | 250 W (PCIe) 300 W (SXM2) | 50 W/75 W | 250 W |
| 硬件加速视频引擎 | 1 个解码引擎,2 个编码引擎 | — | 1 个解码引擎,2 个编码引擎 | 1 个解码引擎,2 个编码引擎 |