NVLINK 5.0: Izboljšana komunikacija GPU-to-GPU za AI in HPC

Kako NVLink 5.0 prenese prenos podatkov med več GPU

NVLink 5.0 je najnovejša ponovitev NVIDIA za tehnologijo medsebojne povezave z visoko hitrostjo, ki je zasnovana za izboljšanje neposredne komunikacije med več GPU znotraj sistema. Ta tehnologija je še posebej ključnega pomena za delovne obremenitve, ki so intenzivni na GPU, kot so AI trening in visokozmogljivo računalništvo. Tukaj je, kako NVLink 5.0 obravnava prenos podatkov med več GPU -ji:

Arhitektura in pasovna širina

NVLink 5.0 je zgrajen za arhitekturo Blackwell in ponuja znatno povečanje pasovne širine v primerjavi s svojimi predhodniki. Vsak Blackwell GPU podpira do 18 povezav NVLink, pri čemer vsaka povezava zagotavlja dvosmerno pasovno širino 100 GB/s. Posledica tega je skupna pasovna širina 1,8 TB/s na GPU, kar je dvakrat večja od prejšnje generacije in več kot 14 -krat večja pasovna širina PCIe Gen5 [1] [2] [4].

Neposredna komunikacija GPU-to-GPU

NVLink omogoča neposredno komunikacijo med GPU -ji brez potrebe po posredniku CPU -ja, kar zmanjšuje zamude in poveča zmogljivost. Ta arhitektura povezave s točko do točke zagotavlja, da ima vsak GPU namensko povezavo do vseh drugih GPU-ja, kar omogoča hitre prenose podatkov brez skupne rabe pasovne širine [7].

NVLink stikalo za razširljivost

Čip Switch NVLink ima ključno vlogo pri skaliranju povezav NVLink na več GPU, tako znotraj in med strežniškimi regali. Olajša vse do vsega komunikacije GPU s popolno hitrostjo NVLink, kar učinkovito spremeni podatkovno središče v velikanski GPU. Ta nastavitev podpira do 576 popolnoma povezanih GPU-jev v ne-blokavni računalniški tkanini, kar omogoča obsežne aplikacije AI in HPC [1] [2] [4].

Kolektivne operacije z ostrimi

Vsako stikalo NVLink vključuje motorje za razširljivo hierarhično združevanje in protokol redukcije NVIDIA (Sharp), ki pospešuje zmanjšanje omrežja in večpredstavnostne operacije. To je bistvenega pomena za kolektivne naloge za visoke hitrosti v okolju AI in HPC, kar omogoča učinkovito obdelavo velikih naborov podatkov in zapletenih modelov [2] [4].

Aplikacije in ugodnosti

NVLink 5.0 je zasnovan za podporo razvoju in uvajanju modelov AI v trilijoni parametra in računalniških aplikacij Exascale. Z zagotavljanjem hitre, učinkovite komunikacije med GPU-ji omogoča hitrejšo izmenjavo podatkov in obdelavo, kar je ključnega pomena za zapletene računske naloge. Ta tehnologija je sestavni del rešitve podatkovnih centrov NVIDIA, ki ponuja brez primere razširljivosti in zmogljivosti za platforme AI in HPC [1] [2] [4].

Navedbe:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-moulti-gpu-communication/
[2] https://www.amax.com/fifth-generation-nvidia-nvlink/
[3] https://www.fibermall.com/blog/nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fs.com/blog/fs-an-overview-of-nvidia-nvlink-2899.html
[6] https://massedcopute.com/faq-answers/?question=how+does+nvlink+handle+Data+Transfer+Between+gpus+In+system+with+Multiple+gpus%3F
[7] https://www.amax.com/unleashing-next-level-gpu-performance-with-nvidia-nvlink/
[8] https://forums.developer.nvidia.com/t/nvlink-support-for-connecting-4-gpus/253975