Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Quel type de capacités de surveillance la station DGX propose-t-elle pour la gestion à distance


Quel type de capacités de surveillance la station DGX propose-t-elle pour la gestion à distance


La station NVIDIA DGX A100 offre des capacités de surveillance robustes pour la gestion à distance, améliorant son convivialité et son efficacité dans l'IA et les environnements informatiques hautes performances. Voici quelques-unes des principales caractéristiques:

1. Contrôleur de gestion des plinthes (BMC): La station DGX A100 comprend un BMC intégré, qui fournit une interface Web pour l'accès et le contrôle à distance. Cette interface permet aux utilisateurs de surveiller divers composants système, y compris des capteurs de température pour les GPU, les DIMM de mémoire, le CPU, la carte d'affichage et la carte mère. De plus, il suit les vitesses du ventilateur, la consommation d'énergie et les tensions du système, affichant à la fois des graphiques historiques et des lectures actuelles [1] [4].

2. Interface IPMI: le BMC prend également en charge IPMI (interface de gestion de la plate-forme intelligente), permettant aux logiciels de surveillance de collecter automatiquement les journaux, les statistiques et les lectures de capteurs sans intervention de l'utilisateur. IPMI comprend une interface série sur LAN (SOL), permettant d'accéder à la console série du système pour gérer les paramètres du BIOS ou le système d'exploitation installé [1].

3. Capacité KVM à distance: l'interface Web propose une fonctionnalité de clavier à distance, vidéo, souris (KVM). Cela permet aux utilisateurs de visualiser l'affichage du système et de le gérer à distance. La fonction KVM prend également en charge le stockage virtuel, permettant aux utilisateurs de monter des volumes distants et d'effectuer des tâches comme la réinstallation du système ou le démarrage à partir d'une image ISO [1].

4. Consolidation du réseau: la station DGX A100 peut consolider les connexions réseau à l'aide de l'interface de bande latérale du contrôleur de réseau (NCSI), permettant à la gestion des connexions de LAN système à distance et régulières via une seule chute de réseau. Cela simplifie la configuration et réduit le nombre de ports requis [1].

5. DGX Station Manager: Bien qu'il ne soit pas spécifique au modèle A100 seul, NVIDIA propose des outils tels que DGX Station Manager pour gérer les ressources sur plusieurs systèmes DGX. Cet outil permet aux utilisateurs de surveiller l'utilisation des ressources, de planifier des travaux et de gérer les autorisations des utilisateurs à partir d'une interface centralisée [10].

Dans l'ensemble, la station DGX A100 offre des capacités complètes de surveillance et de gestion à distance, ce qui le rend adapté aux environnements informatiques locaux et à distance d'IA.

Citations:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[2] https://nvidianews.nvidia.com/news/nvidia-annunces-dgx-spark-and-dgx-station-sersonal-ai-computers
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/security.html
[5] https://www.nvidia.com/en-us/products/workstations/dgx-station/
[6] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[7] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-offers-researchers-ai-data-center-in-a-box.html
[8] https://www.pcmag.com/news/what-is-nvidias-dgx-station-a-new-specialized-desktop-line-for-ai-work
[9] https://www.compecta.com/dgxstation-a100.html
[10] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-coud-advantages-configurations-and-setup-guide