2024年推出的第五代NVLINK标志着其前身的显着进步,尤其是在带宽和可扩展性方面。这是NVLink 5.0和前几代之间的关键差异:
##带宽和速度
-NVLINK 5.0可实现带宽的大幅增加,每GPU提供1.8 TB/s的总双向带宽。这是通过18个NVLINK链路实现的,每个链接能够在每个方向上有50 Gb/s,每个链路的双向双向共100 GB/s [1] [4]。
-NVLink 4.0在Hopper GPU中发现,也支持18个链接,但每个链路的速度较低,速度为50 GB/s,总带宽为900 GB/s [7]。
-NVLink 3.0(如A100)用于Ampere GPU,每链路的带宽为50 GB/s,可提供12个链接,达到总计600 GB/s [7]。
##可扩展性和体系结构
-NVLink 5.0是为Blackwell Architecture设计的,该体系结构已针对多GPU系统进行了优化。它可以在数百个GPU之间进行无缝的通信,使其非常适合Exascale计算和大型AI模型[1] [4]。
- 前几代人同时也支持多GPU配置,但没有提供与NVLink 5.0相同的可扩展性。例如,NVLink 4.0用于Hopper GPU,该GPU也支持大型GPU配置,但带宽较少[7]。
##技术和互连性
-NVLINK 5.0使用了高级PAM4差异对信号传导,类似于NVLink 4.0,但每条车道的数据速率较高[7]。
-NVLink开关在NVLINK 5.0中起着至关重要的作用,从而使GPU之间有效地全力以赴。 NVLink 5开关提供144个端口,非阻滞开关容量为14.4 TB/s,可显着提高多个服务器的可扩展性[4]。
##应用程序和性能
-NVLink 5.0针对高性能计算应用进行了优化,尤其是涉及大型AI模型和Exascale计算的应用程序。它增加的带宽允许GPU之间更快的数据交换,这对于复杂的AI和深度学习任务至关重要[1] [4]。
- 前几代人也集中在高性能应用上,但受其较低带宽的限制。 NVLink 3.0和4.0用于需要高计算功率(例如AI和HPC)的环境中,但与NVLink 5.0相比,对于非常大的模型的容量较小[2] [7]。
总体而言,NVLink 5.0在带宽,可伸缩性和性能方面代表了一个重大的飞跃,将其定位为AI和高性能计算中未来进步的关键组成部分。
引用:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-0-accelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/volution-of-nvlink.htm
[6] https://www.nexgencloud.com/blog/performance-benchmarkss/nvidia-blackwell-vs-nvidia-hopper-a-nvidia-hopper-a-detailed-comparporison
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-volution-of-nvlink