La mise en œuvre de NVINK-C2C dans une station DGX nécessiterait des modifications matérielles importantes, car NVINK-C2C est spécialement conçu pour des systèmes comme le NVIDIA Grace Hopper Superchip, qui intègre à la fois les CPU NVIDIA Grace et les GPU Nvidia Hopper. Voici les principales exigences matérielles et considérations:
1. Nvidia Grace CPU et Hopper GPU Intégration: Nvlink-C2C est utilisé pour connecter le GPU Grace CPU et Hopper dans la même superchip. La station DGX, cependant, utilise généralement des GPU NVIDIA A100, qui ne prennent pas en charge NVlink-C2C. Vous devrez remplacer ou intégrer ces composants avec du matériel compatible.
2. Interconnexion à grande vitesse: NVLink-C2C fournit jusqu'à 900 Go / s de bande passante bidirectionnelle, qui est nettement plus élevée que les connexions PCIe traditionnelles. Pour y parvenir, le système doit prendre en charge la technologie d'interconnexion à grande vitesse de NVINK-C2C, qui n'est pas originaire de l'architecture actuelle de la station DGX.
3. Cohérence de la mémoire: NVINK-C2C prend en charge la cohérence de la mémoire matérielle, permettant un accès transparent à la mémoire à travers CPU et GPU sans copie explicite. Cette fonctionnalité nécessite une prise en charge matérielle spécifique qui n'est pas présente dans les stations DGX standard.
4. puissance et refroidissement: L'intégration de composants haute performance comme celles de la superchip Grace Hopper nécessiterait des systèmes d'alimentation et de refroidissement améliorés pour gérer l'augmentation de la consommation d'énergie et de la production de chaleur.
5. Prise en charge du logiciel: la mise en œuvre de NVINK-C2C nécessite également des logiciels et des pilotes compatibles qui peuvent tirer parti de ses fonctionnalités. Cela peut impliquer la personnalisation ou la mise à jour du système d'exploitation et de la pile logicielle pour prendre en charge la nouvelle configuration matérielle.
En résumé, la mise en œuvre de NVLink-C2C dans une station DGX nécessiterait une refonte fondamentale de l'architecture du système, y compris l'intégration de CPU et de GPU compatibles, des interconnexions à grande vitesse et des solutions de puissance et de refroidissement appropriées. De plus, des modifications logicielles seraient nécessaires pour utiliser pleinement les capacités de NVLink-C2C.
Citations:
[1] https://developer.nvidia.com/blog/nvidia-grace-hopper-superchip-architecture-in-depth/
[2] https://www.nvidia.com/en-us/data-center/nvlink/
[3] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use
[4] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[5] https://en.wikipedia.org/wiki/nvlink
[6] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[7] https://www.nvidia.com/en-us/data-center/nvlink-c2c/
[8] https://blogs.nvidia.com/blog/what-is-nvidia-nvlink/