Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jak Nvlink 5.0 přispívá k výpočtu ExAscale


Jak Nvlink 5.0 přispívá k výpočtu ExAscale


NVLINK 5.0 hraje klíčovou roli při rozvíjení výpočtu ExAscale výrazně zvýšením rychlosti a účinnosti přenosu dat mezi GPU v systému. Zde je to, jak to přispívá:

Vylepšená šířka pásma a rychlost

NVLINK 5.0 nabízí pozoruhodnou obousměrnou šířku pásma 1,8 terabajtů za sekundu (TB/S), což je dvojnásobná šířka pásma svého předchůdce, NVLink 4.0, a více než 14krát větší než 14násobná šířka PCIe Gen5 [1] [4]. Toto podstatné zvýšení šířky pásma umožňuje rychlejší výměnu dat mezi GPU, což je zásadní pro zpracování masivních datových sad typických v aplikacích ExAscale Computing Applications.

Škálovatelnost a komunikace s více GPU

Tato technologie podporuje až 18 spojení NVLink na GPU, z nichž každá pracuje na 100 GB/s, což usnadňuje bezproblémovou komunikaci mezi více GPU [1] [4]. Tato škálovatelnost je nezbytná pro exascale výpočty, kde složité simulace a rozsáhlé modely AI vyžadují koordinované úsilí četných GPU.

NVLink Switch Technology

Přepínač NVLink je kritická součást, která umožňuje všeobecnou komunikaci GPU při plné rychlosti nvlink, a to jak uvnitř, tak mezi regály serverů [4]. Tato schopnost umožňuje vytvoření rozsáhlých klastrů GPU a účinně proměňuje datové centrum na jedinou vysoce výkonnou výpočetní entitu. Přepínač podporuje až 576 GPU v jedné doméně, což výrazně rozšiřuje měřítko výpočtů, které lze provést [4].

Podpora pro modely AI Tillion-Parameter

NVLink 5.0 je navržen tak, aby podporoval vývoj a školení modelů AI s biliony a vícenásobnými parametry. Poskytováním rychlé a efektivní komunikace napříč všemi GPU v clusteru serveru se zabývá rostoucí poptávkou po rychlejším propojení pro propojení nezbytné pro tyto komplexní modely [4] [9].

Snižování úzkých míst dat

Ve vysoce výkonných počítačích jsou úzká místa pro data významnou výzvou. NVLINK 5.0 zmírňuje tyto úzká místa zajištěním, že data mohou být do modelů rychle a efektivně vyměněna mezi GPU. To zkracuje čas potřebný pro komplexní výpočty, což umožňuje vědcům soustředit se na rychleji odvozování poznatků a výsledků [3] [5].

Závěr

NVLink 5.0 je základní technologie ve snaze o výpočet ExAscale, která nabízí bezprecedentní šířku pásma a škálovatelnost, které jsou nezbytné pro zpracování masivních výpočetních zatížení a převodů dat požadovaných v této oblasti. Jeho integrace s technologií NVLink Switch dále zesiluje její schopnosti, což z něj činí základní prvek ve vývoji budoucích vysoce výkonných výpočetních platforem.

Citace:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-molti-gpu-omunication/
[2] https://en.wikichip.org/wiki/nvidia/nvlink
[3] https://www.atlantic.net/gpu-server-hosting/nvidia-nvlink-it-works-use-ases-and-critical-best-tractices/
[4] https://www.amax.com/fift-generation-nvidia-nvlink/
[5] https://www.hpcwire.com/2024/03/25/nvlink-materconnects-and-switchs-to-help-Relieve-tata-bottlenecks/
[6] https://www.serversimply.com/blog/evolution-of-nvidia-tata-center-gpus
[7] https://www.anandtech.com/show/21310/nvidia-lackwell-architecture-and-b200b100-accelerators-anouced-inging-bigger-with-smaller-tata
[8] https://www.fibermall.com/blog/nvidia-nvlink.htm
[9] https://www.nvidia.com/en-us/data-center/nvlink/
[10] https://hc34.hotchips.org/assets/program/conference/day2/network%20and%20switches/nvswitch%20hotchips%202022%20R5.pdf