Den femte generation af NVLink, der blev introduceret i 2024, markerer en betydelig fremgang over sine forgængere, især med hensyn til båndbredde og skalerbarhed. Her er de vigtigste forskelle mellem NVLINK 5.0 og tidligere generationer:
Båndbredde og hastighed
- NVLINK 5.0 tilbyder en betydelig stigning i båndbredde, hvilket giver 1,8 TB/s af den samlede tovejsbåndbredde pr. GPU. Dette opnås gennem 18 nvlink -links, der hver er i stand til 50 GB/s i hver retning, i alt 100 GB/s pr. Link tovejs [1] [4].- NVLINK 4.0, der findes i Hopper GPU'er, understøtter også 18 links, men med en lavere hastighed på 50 GB/s pr. Link, hvilket resulterer i en samlet båndbredde på 900 GB/s [7].
- NVLINK 3.0, brugt i ampere GPU'er som A100, understøtter op til 12 links med en båndbredde på 50 GB/s pr. Link, hvilket opnår i alt 600 GB/s [7].
skalerbarhed og arkitektur
- NVLINK 5.0 er designet til Blackwell-arkitekturen, der er optimeret til multi-GPU-systemer. Det muliggør problemfri kommunikation mellem hundreder af GPU'er, hvilket gør den ideel til exascale computing og store AI -modeller [1] [4].- Tidligere generationer, mens de også støttede multi-GPU-konfigurationer, bød ikke på samme niveau af skalerbarhed som NVLINK 5.0. For eksempel blev NVLINK 4.0 anvendt i Hopper GPU'er, som også understøttede storskala GPU-konfigurationer, men med mindre båndbredde [7].
Teknologi og samtrafik
- NVLINK 5.0 bruger avanceret PAM4-differentiel-par-signalering, svarende til NVLINK 4.0, men med højere datahastigheder pr. Bane [7].-NVLINK-switches spiller en afgørende rolle i NVLINK 5.0, hvilket giver mulighed for effektiv alt-til-alle-kommunikation mellem GPU'er. NVLINK 5-switch tilbyder 144 porte med en ikke-blokerende switching-kapacitet på 14,4 TB/s, hvilket forbedrer skalerbarheden markant på tværs af flere servere [4].
applikationer og ydeevne
- NVLINK 5.0 er optimeret til højtydende computerapplikationer, især dem, der involverer store AI-modeller og exascale computing. Dens øgede båndbredde giver mulighed for hurtigere dataudveksling mellem GPU'er, som er kritisk for komplekse AI og dyb læringsopgaver [1] [4].- Tidligere generationer var også fokuseret på applikationer med højtydende, men var begrænset af deres nedre båndbredde. NVLINK 3.0 og 4.0 blev anvendt i miljøer, der krævede høj beregningseffekt, såsom AI og HPC, men med mindre kapacitet til meget store modeller sammenlignet med NVLINK 5.0 [2] [7].
Generelt repræsenterer NVLINK 5.0 et betydeligt spring fremad med hensyn til båndbredde, skalerbarhed og ydeevne, der placerer det som en kritisk komponent for fremtidige fremskridt inden for AI og højpræstations computing.
Citater:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/evolution-of-nvlink.htm
)
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-evolution-of-nvlink