Implementering av NVLINK-C2C i en DGX-station skulle kräva betydande hårdvaruändringar, eftersom NVLINK-C2C är specifikt utformad för system som NVIDIA Grace Hopper Superchip, som integrerar både NVIDIA GRACE CPU: er och NVIDIA Hopper GPU. Här är de viktigaste hårdvarukraven och övervägandena:
1. NVIDIA GRACE CPU och Hopper GPU-integration: NVLINK-C2C används för att ansluta Grace CPU och Hopper GPU inom samma superchip. DGX-stationen använder emellertid vanligtvis NVIDIA A100 GPU, som inte stöder NVLINK-C2C. Du måste byta ut eller integrera dessa komponenter med kompatibel hårdvara.
2. Höghastighets sammankoppling: NVLINK-C2C tillhandahåller upp till 900 GB/s dubbelriktad bandbredd, vilket är betydligt högre än traditionella PCIe-anslutningar. För att uppnå detta måste systemet stödja NVLINK-C2C: s höghastighetsinterconnect-teknik, som inte är infödd i DGX-stationens nuvarande arkitektur.
3. Minneskoherens: NVLINK-C2C stöder hårdvaruminnekoherens, vilket möjliggör sömlös åtkomst till minne över CPU och GPU utan uttrycklig kopiering. Den här funktionen kräver specifikt hårdvarustöd som inte finns i standard DGX -stationer.
4. Kraft och kylning: Integrationen av högpresterande komponenter som de i Grace Hopper Superchip skulle kräva förbättrad kraftleverans och kylsystem för att hantera den ökade kraftförbrukningen och värmeproduktionen.
5. Programvarustöd: Implementering av NVLINK-C2C kräver också kompatibel programvara och drivrutiner som kan utnyttja dess funktioner. Detta kan innebära att du anpassar eller uppdaterar operativsystemet och programvarustacken för att stödja den nya hårdvarukonfigurationen.
Sammanfattningsvis skulle implementering av NVLINK-C2C i en DGX-station kräva en grundläggande omformning av systemets arkitektur, inklusive integration av kompatibla CPU: er och GPU: er, höghastighetsinterconnects och lämpliga kraft- och kyllösningar. Dessutom skulle mjukvaruändringar krävas för att fullt ut utnyttja kapaciteten för NVLINK-C2C.
Citeringar:
[1] https://developer.nvidia.com/blog/nvidia-grace-hopper-superchip-arkitectectecy-in-depth/
[2] https://www.nvidia.com/en-us/data-center/nvlink/
[3] https://nanoporetech.com/document/nvidia-dgx-station-a100-installations-andy
[4] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[5] https://en.wikipedia.org/wiki/nvlink
[6] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[7] https://www.nvidia.com/en-us/data-center/nvlink-c2c/
[8] https://blogs.nvidia.com/blog/what-is-nvidia-nvlink/