Az NVLink-C2C DGX állomáson történő megvalósítása jelentős hardvermódosításokat igényel, mivel az NVLink-C2C-t kifejezetten olyan rendszerekhez tervezték, mint az NVIDIA GRACE HOPPER SUPERCHIP, amely integrálja mind az NVIDIA GRACE CPUS-t, mind az NVIDIA Hopper GPU-t. Itt vannak a legfontosabb hardverkövetelmények és megfontolások:
1. NVIDIA GRACE CPU és Hopper GPU Integráció: Az NVLink-C2C-t használják a GRACE CPU és a Hopper GPU csatlakoztatásához ugyanazon a szuperchipben. A DGX állomás azonban általában az NVIDIA A100 GPU-kat használja, amelyek nem támogatják az NVLink-C2C-t. Ki kell cserélnie vagy integrálnia ezeket az összetevőket kompatibilis hardverekkel.
2. nagysebességű összekapcsolás: Az NVLink-C2C akár 900 GB/s kétirányú sávszélességet biztosít, amely lényegesen magasabb, mint a hagyományos PCIe-kapcsolatok. Ennek elérése érdekében a rendszernek támogatnia kell az NVLink-C2C nagysebességű összekapcsolási technológiáját, amely nem őshonos a DGX állomás jelenlegi architektúrájában.
3. memória koherencia: Az NVLink-C2C támogatja a hardver memória koherenciáját, lehetővé téve a zökkenőmentes hozzáférést a memóriához a CPU-n és a GPU-n keresztül, explicit másolás nélkül. Ez a szolgáltatás olyan speciális hardver -támogatást igényel, amely a szokásos DGX állomásokon nincs jelen.
4. Teljesítmény és hűtés: A nagy teljesítményű alkatrészek integrációja, mint például a Grace Hopper Superchipben, fokozott energiaellátási és hűtési rendszereket igényelne a megnövekedett energiafogyasztás és a hőtermelés kezelése érdekében.
5. Szoftver-támogatás: Az NVLink-C2C megvalósításához olyan kompatibilis szoftvereket és illesztőprogramokat is igényel, amelyek kiaknázhatják annak funkcióit. Ez magában foglalhatja az operációs rendszer és a szoftvercsomag testreszabását vagy frissítését az új hardverkonfiguráció támogatása érdekében.
Összefoglalva: az NVLink-C2C DGX állomáson történő megvalósítása szükségessé tenné a rendszer architektúrájának alapvető átalakítását, ideértve a kompatibilis CPU-k és GPU-k integrálását, a nagysebességű összeköttetéseket, valamint a megfelelő teljesítmény- és hűtési megoldásokat. Ezenkívül szoftvermódosításokra lenne szükség az NVLink-C2C képességeinek teljes felhasználásához.
Idézetek:
[1] https://developer.nvidia.com/blog/nvidia-grace-hopper-superchip-architecture-in-depth/
[2] https://www.nvidia.com/en-us/data-center/nvlink/
[3] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use
[4] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[5] https://en.wikipedia.org/wiki/nvlink
[6] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[7] https://www.nvidia.com/en-us/data-center/nvlink-c2c/
[8] https://blogs.nvidia.com/blog/what-is-nvidia-nvlink/