Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jakie są kroki, aby skonfigurować inteligentny PDU do monitorowania zasilania na stacji DGX A100


Jakie są kroki, aby skonfigurować inteligentny PDU do monitorowania zasilania na stacji DGX A100


Aby skonfigurować inteligentną jednostkę dystrybucji zasilania (PDU) do monitorowania energii na stacji NVIDIA DGX A100, wykonaj te szczegółowe kroki:

1. Montaż inteligentnego PDU **

- Opcje montażu: Inteligentny PDU może być montowany pionowo lub poziomo w stojaku. Do montażu poziomego wybierz odpowiednie punkty montażu wspornika, aby zapewnić odpowiednią głębokość w stojaku. Połącz wsporniki L śrubami i zainstaluj obudowę do gniazd stojakowych, umożliwiając pewną poziomą adaptację [3].
- Pionowe mocowanie: Użyj zestawu montażowego przycisku dostarczonego z inteligentnym PDU. W razie potrzeby rozpowszechniaj przyciski pionowo i przymocuj je do PDU. Upewnij się, że u góry przyciski są wystarczające, aby przyciski zamontować w dziurach kluczy [3].

2. Podłączenie do źródła zasilania **

- Podłącz inteligentny PDU do odpowiedniego źródła zasilania. Upewnij się, że źródło zasilania pasuje do specyfikacji stacji DGX A100 i samego Smart PDU. Zazwyczaj stacja DGX A100 wymaga źródła zasilania, które może dostarczyć od 100 V do 240 V AC, z określonymi ocenami prądu [1] [7].

3. Podłączanie urządzeń **

- Podłącz stację DGX A100 z inteligentnym PDU za pomocą odpowiednich kabli zasilania. Systemy DGX A100 wykorzystują przewody zasilające blokujące, aby zapewnić bezpieczeństwo i zgodność [1].
- Upewnij się, że wszystkie urządzenia są odpowiednio podłączone i wyłączone przed kontynuowaniem.

4. Łączenie czujników **

- Jeśli Twój inteligentny PDU obsługuje dodatkowe czujniki (np. Czujniki temperatury lub wilgotności), podłącz je zgodnie z instrukcjami producenta. Czujniki te mogą dostarczyć cennych danych środowiskowych do monitorowania i utrzymywania optymalnych warunków pracy [3].

5. Konfigurowanie inteligentnego PDU **

- Zaloguj się: Uzyskaj dostęp do interfejsu internetowego Smart PDU za pomocą domyślnych poświadczeń administratora (np. Admin/admin). Zmień te poświadczenia dotyczące bezpieczeństwa [3].
- Ustawienia sieci: Skonfiguruj ustawienia sieciowe, aby umożliwić zdalne monitorowanie. Ustaw serwery IP, maskę podsieci, bramę i DNS zgodnie z wymaganiami środowiska sieciowego [6].
- Konta użytkowników: Utwórz nowe konta użytkowników administracyjnych i usuń domyślne konto administratora dla ulepszonego bezpieczeństwa [3].
- Nazwy czujników: Jeśli dotyczy, skonfiguruj nazwy dla dowolnych podłączonych czujników, aby łatwo identyfikować źródła danych [3].

6. Łączenie z siecią **

- Podłącz inteligentny PDU do swojej sieci. Umożliwia to zdalny dostęp do monitorowania i konfiguracji. Upewnij się, że połączenie sieciowe jest stabilne i bezpieczne [3].

7. Monitorowanie zużycia energii **

- Użyj interfejsu internetowego Smart PDU lub narzędzi IPMI do monitorowania zużycia energii. PDU może dostarczyć dane w czasie rzeczywistym i historyczne na temat zużycia energii, co jest kluczowe dla zarządzania wydajnością energetyczną i zdolnościami planowania [4].
- Aby uzyskać szczegółowe wskaźniki zużycia energii (np. Całkowita energia od zasilania), może być konieczne użycie narzędzi zewnętrznych, takich jak Prometheus lub napływ, aby zbierać i analizować dane w czasie [4].

8. Integracja ze stacją DGX A100 **

- Upewnij się, że stacja DGX A100 jest odpowiednio podłączona do inteligentnego PDU i że wszystkie kable zasilania są bezpiecznie zablokowane na miejscu, aby zapobiec przypadkowym odłączeniom [1].
-Użyj narzędzi takich jak NVIDIA DCGM lub „NVIDIA-SMI`, aby w razie potrzeby monitorować zużycie energii specyficzne dla GPU [4].

Postępując zgodnie z tymi krokami, możesz skutecznie skonfigurować inteligentny PDU do monitorowania energii na stacji DGX A100, zapewniając wydajne zarządzanie energią i niezawodność systemu.

Cytaty:
[1] http://cdn.cnetcontent.com/2f/68/2f68888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-System-archite-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca