NVLink究竟是个啥？

时间：2022-11-07

　　随着人工智能的不断演进，GPU在高性能计算和深度学习中扮演着越来越重要的角色， GPU强大的并行计算能力，大大提升了运算性能。在运算数据量不断攀升下，GPU间需要进行大量数据交换，GPU通信性能成为了非常重要的指标。

　　为此，NVIDIA推出了能够提升GPU通信性能的技术——GPUDirect P2P技术（使GPU可以通过PCI Express直接访问目标GPU的显存，避免了通过拷贝到CPU host memory作为中转，大大降低了数据交换的延迟），但受限于PCI Express总线协议以及拓扑结构的一些限制，无法做到更高的带宽，为了解决这个问题，NVIDIA提出了NVLink总线协议。

　　PCI Express现状

　　目前PCIe 4.0协议，相较PCIe 3.0已实现带宽翻倍，x16双向带宽达到了64GB/s，而搭载HBM2e显存的NVIDIA A100带宽已可达到1935GB/s。显卡核心和显存之间的数据交换通道已经达到如此带宽，但是GPU之间以及GPU和CPU之间的数据交换受到PCIe总线影响，成为了瓶颈。

　　NVLink

　　为解决PCI Express下的瓶颈，NVIDIA推出了NVLink，可提供更高带宽和更多链路，并可提升多GPU系统配置的可扩展性，有效解决互连问题。

　　于2016年发布的P100是搭载NVLink的第一款产品，具有160 GB/s的带宽，相当于PCIe Gen3*16带宽的5倍。GTC 2017上发布的V100搭载NVLink 2.0，更是将带宽提升到了300 GB/s，差不多达到了PCIe Gen4*16带宽的5倍。

　　而在去年GTC 20中最新发布的NVIDIA A100更是搭载了NVLink 3.0，单个NVIDIA A100 Tensor核心GPU支持多达12个第三代NVLink连接，总带宽为每秒600 GB/s，几乎是PCIe Gen 4带宽的10倍。

　　NVLink Bridge

　　目前，NVLink分为两种，一种是主板是集成了NVLink接口，另一种则是以桥接器的形式实现NVLink高速互联技术。

　　但目前集成NVLink接口的主板极为少数，PCIe仍为主流平台的标配。为使NVLink得到更广泛应用，加速应用程序的运行效率，NVIDIA推出了可通过NVLink技术连接两片高性能GPU的NVLink Bridge，其能实现显存扩展和性能增强，满足人工智能下的超大负载需求。

　　此前，只有Geforce、Titan及Quadro系列中的部分产品支持NVLink Bridge，但全新Ampere下的A100（PCIe版本）、A40、A30、A6000、A5000均已实现NVLink Bridge的支持。在NVLink 3.0技术支持下，A100（PCIe版本）可实现600 GB/s GPU-GPU带宽，A30可实现200 GB/s GPU-GPU带宽，其余则可实现112 GB/s GPU-GPU带宽，大大降低了数据交互的延迟，助力更多端到端计算平台的构建

　　超益集伦作为NVIDIA Elite Partner，可提供专业的产品解决方案与技术服务支持，帮助客户实现高效、稳定的算力升级。

　　举报/反馈