NVIDIA英伟达所有GPU显卡算力及其支持的精度模式
本文整理了NVIDIA官网的数据,为你解开疑惑。
1. 首先了解CUDA计算能力及其支持的精度模式;
2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。
表1 CUDA计算能力及其支持的精度模式
| CUDA Compute Capability | TF32 | FP32 | FP16 | INT8 | FP16 Tensor Cores | INT8 Tensor Cores | DLA |
| 9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8.9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 8.6 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 7.5 | No | Yes | Yes | Yes | Yes | Yes | No |
| 7.2 | No | Yes | Yes | Yes | Yes | Yes | Yes |
| 7 | No | Yes | Yes | Yes | Yes | No | No |
| 6.1 | No | Yes | Yes | Yes | No | No | No |
| 6 | No | Yes | Yes | No | No | No | No |
表2 NVIDIA 硬件(包含显卡、嵌入式板卡等)对应的计算能力
通过以上两表,可了解每个硬件支持的精度模式。
参考:
Support Matrix :: NVIDIA Deep Learning TensorRT Documentation
CUDA GPUs - Compute Capability | NVIDIA Developer