Piektās paaudzes NVLink, kas ieviests 2024. gadā, iezīmē ievērojamu progresu pār tā priekšgājējiem, jo īpaši attiecībā uz joslas platumu un mērogojamību. Šeit ir galvenās atšķirības starp NVLink 5.0 un iepriekšējām paaudzēm:
joslas platums un ātrums
- NVLink 5.0 piedāvā ievērojamu joslas platuma palielināšanos, nodrošinot 1,8 TB/s kopējā divvirzienu joslas platuma uz GPU. Tas tiek panākts caur 18 NVLink saitēm, katrā no tām ir 50 GB/s katrā virzienā, kopā 100 GB/s vienā saitē [1] [4].- NVLink 4.0, kas atrodams Hopper GPU, atbalsta arī 18 saites, bet ar zemāku ātrumu 50 GB/s vienā saitē, kā rezultātā kopējais joslas platums ir 900 GB/s [7].
- NVLink 3.0, ko izmanto ampēru GPU, piemēram, A100, atbalsta līdz 12 saitēm ar joslas platumu 50 GB/s vienā saitē, sasniedzot kopumā 600 GB/s [7].
mērogojamība un arhitektūra
- NVLINK 5.0 ir paredzēts Blackwell arhitektūrai, kas ir optimizēta vairāku GPU sistēmām. Tas ļauj nemanāmi sazināties starp simtiem GPU, padarot to ideālu eksascale skaitļošanai un lieliem AI modeļiem [1] [4].- Iepriekšējās paaudzes, lai arī atbalstīja arī vairāku GPU konfigurācijas, nepiedāvāja tādu pašu mērogojamības līmeni kā NVLink 5.0. Piemēram, NVLink 4.0 tika izmantots Hopper GPU, kas atbalstīja arī liela mēroga GPU konfigurācijas, bet ar mazāku joslas platumu [7].
Tehnoloģija un savienojamība
- NVLink 5.0 izmanto uzlabotu PAM4 diferenciālo pāra signālu signālu, līdzīgi kā NVLink 4.0, bet ar lielāku datu pārraides ātrumu uz vienu joslu [7].-NVLink slēdžiem ir izšķiroša loma NVLink 5.0, ļaujot efektīvai komunikācijai starp GPU. NVLink 5 slēdzis piedāvā 144 portus ar bloķējošu komutācijas jaudu 14,4 TB/s, ievērojami uzlabojot mērogojamību vairākos serveros [4].
lietojumprogrammas un veiktspēja
- NVLINK 5.0 ir optimizēts augstas veiktspējas skaitļošanas lietojumprogrammām, jo īpaši tām, kurās iesaistīti lieli AI modeļi un eksaskālas skaitļošana. Tā palielinātais joslas platums ļauj ātrāk veikt datu apmaiņu starp GPU, kas ir kritiski svarīgs sarežģītiem AI un dziļas mācīšanās uzdevumiem [1] [4].- Iepriekšējās paaudzes bija vērstas arī uz augstas veiktspējas lietojumprogrammām, bet tās ierobežoja to apakšējā joslas platums. NVLink 3.0 un 4.0 tika izmantoti vidē, kurai nepieciešama liela skaitļošanas jauda, piemēram, AI un HPC, bet ar mazāku spēju ļoti lieliem modeļiem, salīdzinot ar NVLink 5.0 [2] [7].
Kopumā NVLink 5.0 ir nozīmīgs lēciens uz joslas platuma, mērogojamības un veiktspējas ziņā, pozicionējot to kā kritisku komponentu turpmākajiem sasniegumiem AI un augstas veiktspējas skaitļošanai.
Atsauces:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/evolution-of-nvlink.htm
[6.]
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-evolution-of-nvlink