Чтобы настроить интеллектуальный блок распределения питания (PDU) для мониторинга питания на станции NVIDIA DGX A100, выполните эти подробные шаги:
1. монтаж умного PDU **
- Параметры монтажа: умный PDU может быть установлен либо вертикально, либо горизонтально в стойке. Для горизонтального монтажа выберите соответствующие точки монтажа кронштейнов, чтобы обеспечить надлежащую глубину внутри стойки. Прикрепите L-кронштейны с винтами и установите корпус в слоты стойки, что позволяет получить горизонтальную адаптивность [3].- Вертикальное монтаж: используйте набор для монтажа кнопки, предоставляемый с интеллектуальным PDU. Распределите кнопки вертикально и прикрепите их к PDU по мере необходимости. Убедитесь, что в верхней части достаточно зазора, чтобы кнопки могли установить на косочистки [3].
2. Подключение к источнику питания **
- Подключите умный PDU к подходящему источнику питания. Убедитесь, что источник питания соответствует спецификациям станции DGX A100 и самого умного PDU. Как правило, на станции DGX A100 требуется источник питания, который может поставлять 100 В до 240 В переменного тока, с конкретными оценками тока [1] [7].3. Подключение устройств **
- Подключите станцию DGX A100 к интеллектуальному PDU, используя соответствующие кабели питания. Системы DGX A100 используют блокирующие шнуры питания для обеспечения безопасности и соответствия [1].- Убедитесь, что все устройства правильно подключены и отключены до продолжения.
4. Соединительные датчики **
- Если ваш умный PDU поддерживает дополнительные датчики (например, датчики температуры или влажности), подключите их в соответствии с инструкциями производителя. Эти датчики могут предоставить ценные данные окружающей среды для мониторинга и поддержания оптимальных условий работы [3].5. Настройка Smart PDU **
- Войти: доступ к веб -интерфейсу Smart PDU с помощью учетных данных администратора по умолчанию (например, Admin/Admin). Измените эти учетные данные для безопасности [3].- Настройки сети: Настройте настройки сети, чтобы включить удаленный мониторинг. Установите IP -адрес, маски подсети, шлюз и DNS -серверы по мере необходимости для вашей сетевой среды [6].
- Учетные записи пользователей: создайте новые учетные записи административных пользователей и удалите учетную запись администратора по умолчанию для повышения безопасности [3].
- Имена датчиков: если применимо, настройте имена для любых подключенных датчиков, чтобы легко идентифицировать источники данных [3].
6. Подключение к сети **
- Подключите умный PDU к вашей сети. Это обеспечивает удаленный доступ для мониторинга и конфигурации. Убедитесь, что сетевое соединение стабильное и безопасное [3].7. Мониторинг энергопотребления **
- Используйте веб -интерфейс Smart PDU или инструменты IPMI для мониторинга энергопотребления. PDU может предоставить в режиме реального времени и исторические данные об использовании мощности, что имеет решающее значение для управления энергоэффективностью и способностью планирования [4].- Для получения подробных показателей потребления энергии (например, общей энергии с момента питания) вам может потребоваться использовать внешние инструменты, такие как Prometheus или InfluxDB для сбора и анализа данных с течением времени [4].
8. Интеграция с DGX Station A100 **
- Убедитесь, что станция DGX A100 правильно подключена к интеллектуальному PDU и что все электроэнергии надежно заблокированы на месте, чтобы предотвратить случайные разъединения [1].-Используйте такие инструменты, как NVIDIA DCGM или `NVIDIA-SMI`, для мониторинга энергопотребления, специфичного для GPU, при необходимости [4].
Следуя этим этапам, вы можете эффективно настроить интеллектуальный PDU для мониторинга питания на вашей станции DGX A100, обеспечивая эффективное управление энергией и надежность системы.
Цитаты:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca