La station DGX A100 suit et affiche les tensions du système via son contrôleur de gestion des plinthes (BMC), qui fournit un système de surveillance complet. Ce BMC propose une interface utilisateur sur le Web qui permet aux utilisateurs d'accéder et d'examiner en toute sécurité les lectures des capteurs, y compris les tensions système, ainsi que d'autres mesures système critiques telles que la température, les vitesses du ventilateur et la consommation d'énergie. Ces fonctionnalités sont également accessibles via les interfaces IPMI, permettant une surveillance automatisée sans intervention utilisateur.
L'interface BMC comprend des graphiques historiques et des lectures actuelles pour ces mesures, offrant un aperçu détaillé des performances et de la santé du système. Cette capacité est cruciale pour maintenir des conditions de système optimales, en particulier dans les environnements où un contrôle de tension précis est nécessaire pour un fonctionnement stable. De plus, le BMC prend en charge les fonctionnalités de gestion à distance comme Serial Over LAN (SOL) et le clavier, la vidéo, la souris (KVM), permettant la gestion et le dépannage du système distant.
Pour un suivi et une analyse détaillés, les utilisateurs peuvent intégrer les données BMC avec des outils de surveillance externes ou des bases de données pour collecter et analyser les données historiques au fil du temps. Cette approche aide à identifier les tendances et les anomalies dans les tensions du système, ce qui est essentiel pour maintenir la fiabilité et l'efficacité de la station DGX A100.
En résumé, les tensions système de la station DGX A100 sont suivies et affichées grâce à une combinaison de l'interface Web de son BMC et des capacités IPMI, fournissant des données en temps réel et historiques pour une gestion efficace du système.
Citations:
[1] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[2] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[6] https://www.megware.com/fileadmin/user_upload/landingpage%20nvidia/nvidia-ampere-architecture-whitepaper.pdf
[7] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[8] https://www.youtube.com/watch?v=i6nx74lqtca
[9] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use