NVIDIA L4 是一款用于高效视频、AI 和图形的突破性通用加速器,NVIDIA L4 Tensor Core GPU 为从企业本地、云端到边缘的各种视频、AI、虚拟桌面和图形应用提供通用加速和能效。借助 NVIDIA 的 AI 平台和全栈式方案,NVIDIA L4 已经过优化,可以为广泛的 AI 应用进行大规模的推理,包括推荐系统、基于语音的 AI 化身助手、生成式 AI、视觉搜索和客服中心自动化,以提供最佳的个性化体验。
作为适用于主流应用的当前最高效的 NVIDIA 加速器,与 CPU 解决方案相比,NVIDIA L4 服务器的 AI 视频性能提高了 120 倍,生成式 AI 性能提高了 2.7 倍,图形性能也比使用上一代 GPU 时提高了 4 倍以上。NVIDIA L4 的多功能性和节能、单插槽、半高外形规格使其成为全球部署(包括边缘位置)的理想选择。
规格
FP32 | 30.3 teraFLOPS |
TF32 Tensor 核心 | 120 teraFLOP* |
BFLOAT16 Tensor 核心 | 242 teraFLOPS* |
FP16 Tensor 核心 | 242 teraFLOPS* |
FP8 Tensor 核心 | 485 teraFLOPS* |
INT8 Tensor 核心 | 485 teraFLOPS* |
GPU 显存 | 24GB |
编码/译码 |
1 个编码器 2 个译码器 (+AV1 解码) |
GPU 内存 | 24GB GDDR6 |
GPU 显存带宽 | 300GB/S |
NVENC | NVDEC |JPEG 解码器 | 2 | 4 | 4 |
尺寸规格 | 单插槽半高, PCIe |
最大热设计功率 (TDP) |
72W |
互联技术 | PCIe 4.0x16 64GB/s |
* 表示采用稀疏技术。在不采用稀疏技术的情况下,性能降低一半