NVLINK 5.0 je nejnovější iterace NVIDIA své technologie propojení ultra vysoké rychlosti, která je navržena tak, aby zlepšila přímou komunikaci mezi více GPU v systému. Tato technologie je zvláště důležité pro pracovní zatížení GPU, jako je školení AI a vysoce výkonná výpočetní technika. Zde je způsob, jak NVLINK 5.0 zpracovává přenos dat mezi více GPU:
Architektura a šířka pásma
NVLink 5.0 je postaven pro architekturu Blackwell a nabízí významný nárůst šířky pásma ve srovnání s jejími předchůdci. Každý GPU Blackwell podporuje až 18 připojení NVLink, přičemž každý odkaz poskytuje obousměrnou šířku pásma 100 GB/s. To má za následek celkovou šířku pásma 1,8 Tb/s na GPU, což je dvojnásobné u předchozí generace a více než 14krát větší šířku pásma PCIe Gen5 [1] [2] [4].
Direct GPU-to-GPU komunikace
NVLink umožňuje přímou komunikaci mezi GPU bez potřeby zprostředkovatele CPU, snižování latence a maximalizace výkonu. Tato architektura připojení point-to-point zajišťuje, že každý GPU má vyhrazený odkaz na všechny jiné GPU, což umožňuje rychlé převody dat bez sdílení šířky pásma [7].
Nvlink Switch pro škálovatelnost
Chip přepínače NVLink hraje rozhodující roli při škálování připojení NVLink napříč více GPU, a to jak uvnitř, tak mezi regály serverů. Usnadňuje všeobecnou komunikaci GPU při plné rychlosti NVLink a účinně proměňuje datové centrum na obří GPU. Toto nastavení podporuje až 576 plně připojených GPU v neblokovací výpočetní tkanině, což umožňuje rozsáhlé aplikace AI a HPC [1] [2] [4].
Kolektivní operace s Sharp
Každý přepínač NVLink obsahuje motory pro škálovatelné hierarchické agregace a redukční protokol NVIDIA (SHARP), který urychluje snížení sítě a operace vícesměrového vysílání. To je nezbytné pro vysokorychlostní kolektivní úkoly v prostředí AI a HPC, což umožňuje efektivní zpracování velkých datových sad a komplexních modelů [2] [4].
Aplikace a výhody
NVLINK 5.0 je navržen tak, aby podporoval vývoj a nasazení bilionských parametrových AI modelů a aplikací ExAscale Computing. Poskytováním vysokorychlostní a efektivní komunikace mezi GPU umožňuje rychlejší výměnu a zpracování dat, což je rozhodující pro komplexní výpočetní úkoly. Tato technologie je nedílnou součástí řešení datových center NVIDIA a nabízí bezprecedentní škálovatelnost a výkon pro platformy AI a HPC [1] [2] [4].
Citace:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-molti-gpu-omunication/
[2] https://www.amax.com/fift-generation-nvidia-nvlink/
[3] https://www.fibermall.com/blog/nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fs.com/blog/fs-an-overview-of-nvidia-nvlink-2899.html
[6] https://massedcompute.com/faq-answers/?Question=How+does+nvlink+Handle+Data+transfer+Between mezi+gpus+in+A+System+With+Multiple+GPUS%3F
[7] https://www.amax.com/unleashing-next-level-gU-Performance-with-nvidia-nvlink/
[8] https://forums.developer.nvidia.com/t/nvlink-support-for-connecting-4-gpus/253975