概况
NVIDIA L40是一款专门为数据中心提供出色视觉计算性能的GPU;从虚拟工作站应用到大规模建模和仿真,现代视觉计算和科学工作流处理的任务数量不断增长,复杂程度不断提高。企业需要可提供超强性能并借助多种功能实现扩展的数据中心技术,以便在处理日益复杂的工作负载时,满足其多样化的计算需求。NVIDIA L40 GPU 为数据中心带来出色的视觉计算性能,提供新一代图形、计算和 AI 功能。NVIDIA L40 基于革命性的 NVIDIA Ada Lovelace 架构构建,利用新一代 RT、Tensor 和 CUDA Core 核心的强大功能,为要求严苛的数据中心工作负载提供突破性的可视化和计算性能
特性
由 NVIDIA Ada Lovelace 架构提供支持
第三代 RT Core
增强的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,加速产品设计和架构、工程和施工工作流的渲染。借助硬件加速的动态模糊技术,提供令人惊叹的实时动画效果,从而了解逼真设计的实际应用情况。
第四代 Tensor Core
硬件支持面向结构化稀疏和优化的 TF32 格式,为更快的 AI 和数据科学模型训练提供开箱即用的性能提升。加速 AI 增强型图形功能(包括 DLSS),在选定应用中提供更高分辨率和更出色的性能。
大容量显存
超快 GDDR6 显存容量高达 48GB,可处理显存密集型应用和工作负载,例如数据科学、仿真、3D 建模和渲染。使用 vGPU 软件为多个用户分配显存,以便在创意、数据科学和设计团队中分配大型工作负载。
数据中心就绪型
NVIDIA L40 专为全天候企业数据中心运营而设计,配备节能高效的硬件和组件,经过优化后,可大规模部署,并为各种数据中心工作负载提供卓越性能。L40 包括搭载硬件信任根技术的安全启动,可提供额外的安全层,并且 L40 已达到 NEBS 3 级标准,符合新的数据中心标准。L40 采用被动冷却、节能高效的双插槽设计,适用于知名 OEM 供应商的各种 NVIDIA 认证系统™
规格GPU 架构 | NVIDIA Ada Lovelace 架构 |
GPU 显存 | 带有 ECC 的 48GB GDDR6 |
显存带宽 | 864Gb/s |
互联接口 | PCIe 4.0x16:64Gb/s 双向 |
基于 NVIDIA Ada Lovelace 架构的
CUDA Core 核心
|
18,176 |
NVIDIA 第三代 RT Core | 142 |
NVIDIA 第四代 Tensor Core | 568 |
RT Core 性能 TFLOPS | 209 |
FP32 TFLOPS | 90.5 |
TF32 Tensor Core TFLOPS | 90.5 | 181** |
Bfloat16 浮点运算性能 Tensor Core TFLOPS | 181.05 | 362.1** |
FP16 Tensor Core | 181.05 | 362.1** |
FP8 Tensor Core | 362 | 724** |
INT8 Tensor TOPS 峰值
INT4 Tensor TOPS 峰值
|
362 | 724**
724 | 1448**
|
外形规格 | 4.4"(高)x 10.5"(长)- 双插槽 |
显示端口 | 4 个 DisplayPort 1.4a |
最大功耗 | 300 瓦 |
电源接口 | 16 针 |
散热 | 被动 |
支持虚拟 GPU (vGPU) 软件 | 是 |
支持 vGPU 配置文件 | 请参阅《虚拟 GPU 许可指南》 |
NVENC | NVDEC | 3x | 3x(包含 AV1 编码和解码) |
通过硬件信任根进行安全启动 | 是 |
NEBS Ready | 3 级 |
MIG 支持 | 否 |
NVLink 支持 | 否 |
* 初步规格 – 可能会有所变更。
** 采用稀疏技术