Система станції NVIDIA DGX A100 забезпечує всебічні можливості моніторингу поза температурою. Поряд з моніторингом температури для GPU, Dimms пам'яті, процесора, карткою дисплея та материнської плати, система також відстежує кілька інших критичних компонентів та показників продуктивності. До них належать:
- Швидкість вентилятора: Система контролює швидкість вентиляторів для забезпечення оптимального потоку повітря та ефективності охолодження, що має вирішальне значення для підтримки продуктивності та запобігання перегріву.
- Споживання електроенергії: моніторинг споживання електроенергії допомагає в управлінні використанням енергії та забезпеченню роботи системи в безпечних межах. Це особливо важливо для системи, призначеної для використання в офісних умовах без спеціалізованої електроенергії.
- Напруги системи: Моніторинг напруги є важливим для підтримки стабільної роботи системи. Це допомагає виявити будь -які коливання напруги, які можуть вплинути на продуктивність системи або довговічність.
Ці можливості моніторингу доступні через веб-інтерфейс користувача та інтерфейс IPMI (інтелектуальний інтерфейс управління платформою). Веб -інтерфейс надає історичні графіки та поточні читання для цих показників, що дозволяє детальний аналіз та управління продуктивністю системи. Крім того, система підтримує функції віддаленого управління, включаючи серійну LAN (SOL) для доступу до серійної консолі та віддаленої клавіатури, відео, миші (KVM) для управління системою [1].
Цитати:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[2] https://www.horizoniq.com/blog/nvidia-a100-sces/
[3] https://www.redbooks.ibm.com/redpapers/pdfs/redp5688.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[6] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[7] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[8] https://docs.nvidia.com/dgx/pdf/dgxa100-user-guide.pdf
[9] https://www.compecta.com/dgxstation-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-usure