Izvajanje NVLink-C2C v postaji DGX bi zahtevalo pomembne spremembe strojne opreme, saj je NVLink-C2C zasnovan posebej za sisteme, kot je NVIDIA Grace Hopper Superchip, ki združuje tako Nvidia Grace CPUS kot Nvidia Hopper GPU. Tu so ključne zahteve in pomisleki o strojni opremi:
1. NVIDIA Grace CPU in integracija GPU-ja HOPPER: NVLINK-C2C se uporablja za priključitev milosti CPU in HOPPER GPU znotraj istega superhipa. Postaja DGX pa običajno uporablja Nvidia A100 GPU, ki ne podpirajo NVLink-C2C. Te komponente bi morali zamenjati ali integrirati s združljivo strojno opremo.
2. Hitro povezava: NVLINK-C2C zagotavlja do 900 GB/s dvosmerne pasovne širine, kar je bistveno večje od tradicionalnih povezav PCIe. Da bi to dosegel, mora sistem podpreti tehnologijo medsebojne povezave NVLink-C2C, ki ni domača v trenutni arhitekturi postaje DGX.
3. Koherenca pomnilnika: NVLINK-C2C podpira skladnost strojne opreme, kar omogoča brezhiben dostop do pomnilnika po CPU in GPU brez izrecnega kopiranja. Ta funkcija zahteva posebno podporo strojne opreme, ki ni prisotna v standardnih DGX postajah.
4. Moč in hlajenje: integracija visokozmogljivih komponent, kot so tiste v Grace Hopper Superchip, bi potrebovali izboljšane sisteme za dovajanje energije in hlajenja, da bi lahko obvladali povečano porabo energije in proizvodnjo toplote.
5. Podpora za programsko opremo: Za izvajanje NVLink-C2C je potrebna tudi združljiva programska oprema in gonilnike, ki lahko izkoristijo njegove funkcije. To lahko vključuje prilagajanje ali posodabljanje operacijskega sistema in programske opreme za podporo nove konfiguracije strojne opreme.
Če povzamemo, bi izvajanje NVLINK-C2C v postaji DGX potrebovalo temeljno preoblikovanje arhitekture sistema, vključno z integracijo združljivih CPU-jev in GPU-jev, visokih hitrosti medsebojnih povezav ter ustreznimi rešitvami za moč in hlajenje. Poleg tega bi bile potrebne spremembe programske opreme za popolno uporabo zmogljivosti NVLink-C2C.
Navedbe:
[1] https://developer.nvidia.com/blog/nvidia-race-hopper-superchip-architecture-in-dipth/
[2] https://www.nvidia.com/en-us/data-center/nvlink/
[3] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-ause
[4] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[5] https://en.wikipedia.org/wiki/nvlink
[6] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[7] https://www.nvidia.com/en-us/data-center/nvlink-c2c/
[8] https://blogs.nvidia.com/blog/what-is-nvidia-nvlink/