L'interface du contrôleur de gestion des plinthes (BMC) dans la station A100 NVIDIA DGX fournit une surveillance complète de la température pour divers composants système. Cela comprend la surveillance des températures des GPU, des DIMM de mémoire, du CPU, de la carte d'affichage et de la carte mère. Le BMC permet aux administrateurs système d'accéder à ces lectures de température à distance via une interface Web sécurisée. Cette interface offre des informations détaillées sur les capteurs du système, y compris les graphiques historiques et les lectures actuelles pour les températures, les vitesses de ventilateur, la consommation d'énergie et les tensions du système [1] [6].
Le BMC prend également en charge les interfaces IPMI (Intelligent Platform Management Interface), qui permettent à des logiciels de surveillance de collecter automatiquement les journaux, les statistiques et les lectures de capteurs sans intervention de l'utilisateur. Cela permet une surveillance et une gestion continues des conditions thermiques du système, garantissant des performances optimales et prévenir les problèmes de surchauffe [1] [6].
De plus, le BMC fournit une interface série sur LAN (SOL), permettant aux administrateurs d'accéder à la console série du système pour gérer les paramètres du BIOS ou le système d'exploitation installé. Cette capacité d'accès à distance est cruciale pour maintenir la santé et les performances du système, en particulier dans les environnements où l'accès physique peut être limité [1] [6].
Le système de refroidissement innovant basé sur la réfrigération de la station DGX A100 améliore encore la gestion de la température en gérant efficacement des températures de composants plus élevées sans nécessiter de maintenance, telles que les contrôles de niveau d'eau ou les recharges. Cette conception garantit que le système fonctionne tranquillement et en toute sécurité dans les environnements de bureau, en maintenant des températures optimales pour tous les composants [1].
Citations:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[2] https://www.advanced-integration.ae/wp-content/uploads/2022/08/dgx_station_a100_datasheet_ai-webonly.pdf
[3] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/hardware-specifications-station-a100.html
[5] https://www.mdpi.com/1996-1073/14/2/376
[6] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/using-bmc.html
[7] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use
[8] https://mcomputers.cz/en/products-and-services/nvidia/dgx-systems/nvidia-dgx-station-a100/