Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Каковы шаги по настройке интеллектуального PDU для мониторинга питания на станции DGX A100


Каковы шаги по настройке интеллектуального PDU для мониторинга питания на станции DGX A100


Чтобы настроить интеллектуальный блок распределения питания (PDU) для мониторинга питания на станции NVIDIA DGX A100, выполните эти подробные шаги:

1. монтаж умного PDU **

- Параметры монтажа: умный PDU может быть установлен либо вертикально, либо горизонтально в стойке. Для горизонтального монтажа выберите соответствующие точки монтажа кронштейнов, чтобы обеспечить надлежащую глубину внутри стойки. Прикрепите L-кронштейны с винтами и установите корпус в слоты стойки, что позволяет получить горизонтальную адаптивность [3].
- Вертикальное монтаж: используйте набор для монтажа кнопки, предоставляемый с интеллектуальным PDU. Распределите кнопки вертикально и прикрепите их к PDU по мере необходимости. Убедитесь, что в верхней части достаточно зазора, чтобы кнопки могли установить на косочистки [3].

2. Подключение к источнику питания **

- Подключите умный PDU к подходящему источнику питания. Убедитесь, что источник питания соответствует спецификациям станции DGX A100 и самого умного PDU. Как правило, на станции DGX A100 требуется источник питания, который может поставлять 100 В до 240 В переменного тока, с конкретными оценками тока [1] [7].

3. Подключение устройств **

- Подключите станцию ​​DGX A100 к интеллектуальному PDU, используя соответствующие кабели питания. Системы DGX A100 используют блокирующие шнуры питания для обеспечения безопасности и соответствия [1].
- Убедитесь, что все устройства правильно подключены и отключены до продолжения.

4. Соединительные датчики **

- Если ваш умный PDU поддерживает дополнительные датчики (например, датчики температуры или влажности), подключите их в соответствии с инструкциями производителя. Эти датчики могут предоставить ценные данные окружающей среды для мониторинга и поддержания оптимальных условий работы [3].

5. Настройка Smart PDU **

- Войти: доступ к веб -интерфейсу Smart PDU с помощью учетных данных администратора по умолчанию (например, Admin/Admin). Измените эти учетные данные для безопасности [3].
- Настройки сети: Настройте настройки сети, чтобы включить удаленный мониторинг. Установите IP -адрес, маски подсети, шлюз и DNS -серверы по мере необходимости для вашей сетевой среды [6].
- Учетные записи пользователей: создайте новые учетные записи административных пользователей и удалите учетную запись администратора по умолчанию для повышения безопасности [3].
- Имена датчиков: если применимо, настройте имена для любых подключенных датчиков, чтобы легко идентифицировать источники данных [3].

6. Подключение к сети **

- Подключите умный PDU к вашей сети. Это обеспечивает удаленный доступ для мониторинга и конфигурации. Убедитесь, что сетевое соединение стабильное и безопасное [3].

7. Мониторинг энергопотребления **

- Используйте веб -интерфейс Smart PDU или инструменты IPMI для мониторинга энергопотребления. PDU может предоставить в режиме реального времени и исторические данные об использовании мощности, что имеет решающее значение для управления энергоэффективностью и способностью планирования [4].
- Для получения подробных показателей потребления энергии (например, общей энергии с момента питания) вам может потребоваться использовать внешние инструменты, такие как Prometheus или InfluxDB для сбора и анализа данных с течением времени [4].

8. Интеграция с DGX Station A100 **

- Убедитесь, что станция DGX A100 правильно подключена к интеллектуальному PDU и что все электроэнергии надежно заблокированы на месте, чтобы предотвратить случайные разъединения [1].
-Используйте такие инструменты, как NVIDIA DCGM или `NVIDIA-SMI`, для мониторинга энергопотребления, специфичного для GPU, при необходимости [4].

Следуя этим этапам, вы можете эффективно настроить интеллектуальный PDU для мониторинга питания на вашей станции DGX A100, обеспечивая эффективное управление энергией и надежность системы.

Цитаты:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca