Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Какие другие компоненты контролируются наряду с температурой на станции DGX A100


Какие другие компоненты контролируются наряду с температурой на станции DGX A100


Система Nvidia DGX Station A100 предоставляет комплексные возможности мониторинга за пределы температуры. Наряду с температурным мониторингом для графических процессоров, DIMM памяти, процессора, дисплея и материнской платы, система также отслеживает несколько других критических компонентов и показателей производительности. К ним относятся:

- Скорость вентилятора: система контролирует скорость вентилятора, чтобы обеспечить оптимальную эффективность воздушного потока и охлаждения, что имеет решающее значение для поддержания производительности и предотвращения перегрева.
- Потребляемая энергопотребление: мониторинг энергопотребления помогает в управлении потреблением энергии и обеспечению работы системы в безопасных пределах. Это особенно важно для системы, предназначенной для использования в офисных средах без специализированной энергетической инфраструктуры.
- Системные напряжения: мониторинг напряжения необходим для поддержания стабильной работы системы. Это помогает обнаружить любые колебания напряжения, которые могут повлиять на производительность системы или долговечность.

Эти возможности мониторинга доступны через веб-интерфейс пользовательского интерфейса и интерфейсы IPMI (интеллектуальное управление платформой). Веб -интерфейс предоставляет исторические графики и текущие показания для этих метрик, что позволяет для подробного анализа и управления производительности системы. Кроме того, система поддерживает функции удаленного управления, в том числе сериал Over LAN (SOL) для доступа к серийной консоли и удаленной клавиатуре, видео, мыши (KVM) для управления системой с расстояния [1].

Цитаты:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[2] https://www.horizoniq.com/blog/nvidia-a100-pecs/
[3] https://www.redbooks.ibm.com/redpapers/pdfs/redp5688.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[6] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[7] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[8] https://docs.nvidia.com/dgx/pdf/dgxa100-user-guide.pdf
[9] https://www.compepta.com/dgxstation-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use