NVIDIA A40 是一款适用于视觉计算的强大数据中心 GPU,采用NVIDIA Ampere 架构,NVIDIA A40将 RT Core、Tensor Core 和 CUDA® 核心与 48 GB图形显存相完美结合,而被广泛的用于数据中心严苛要求的视觉计算工作负载环境的加速,同时随时随地访问的强大虚拟工作站到专用的渲染节点,NVIDIA A40 将新一代 NVIDIA RTX™ 技术引入数据中心,处理更先进的专业可视化工作负载。
规格
架构 | NVIDIA Ampere 架构 |
显存 | 带有 ECC 的 48 GB GDDR6 |
显存带宽 | 696 GB/秒 |
互联接口 |
NVIDIA® NVLink ® 112.5 GB/s (双向) PCIe 4.0 31.5 GB/s(双向 |
基于 NVIDIA Ampere 架构的 CUDA 核心 |
10752 |
NVIDIA 第二代 RT Core | 84 |
NVIDIA 第三代 Tensor Core | 336 |
FP32 TFLOPS 峰值 (非 Tensor) | 37.4 |
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值 |
149.7| 299.4* |
TF32 Tensor TFLOPS 峰值 | 74.8| 149.6* |
RT Core 性能 TFLOPS | 73.1 |
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值 |
149.7| 299.4 |
INT8 Tensor TOPS 峰值 INT 4 Tensor TOPS 峰值 |
299.3| 598.6* 598.7 | 1197.4* |
外形规格 | 4.4"(高)x 10.5"(长)双插槽 |
显示端口 |
3 个 DisplayPort 1.4**;支持 NVIDIA Mosaic 和 Quadro ® Sync |
最大功耗 | 300瓦 |
电源接口 | 8 引脚 CPU |
散热解决方案 | 被动式 |
虚拟 GPU (vGPU) 软件支持 | NVIDIA vPC/vApp、NVIDIA RTX 虚拟、工作站、NVIDIA 虚拟计算服务器 |
NVENC | NVDEC | 1x| 2x(包括 AV1 解码) |
通过硬件信任根进行安全可靠的引导 | 是 |
NEBS Ready | 3级 |
计算API |
CUDA、DirectCompute、 OpenCL™、OpenACC |
图形API | DirectX 12.07 、Shader Model 5.17 、OpenGL 4.68 、Vulkan 1.18 |
MIG 支持 | 否 |