Aby skonfigurować inteligentną jednostkę dystrybucji zasilania (PDU) do monitorowania energii na stacji NVIDIA DGX A100, wykonaj te szczegółowe kroki:
1. Montaż inteligentnego PDU **
- Opcje montażu: Inteligentny PDU może być montowany pionowo lub poziomo w stojaku. Do montażu poziomego wybierz odpowiednie punkty montażu wspornika, aby zapewnić odpowiednią głębokość w stojaku. Połącz wsporniki L śrubami i zainstaluj obudowę do gniazd stojakowych, umożliwiając pewną poziomą adaptację [3].- Pionowe mocowanie: Użyj zestawu montażowego przycisku dostarczonego z inteligentnym PDU. W razie potrzeby rozpowszechniaj przyciski pionowo i przymocuj je do PDU. Upewnij się, że u góry przyciski są wystarczające, aby przyciski zamontować w dziurach kluczy [3].
2. Podłączenie do źródła zasilania **
- Podłącz inteligentny PDU do odpowiedniego źródła zasilania. Upewnij się, że źródło zasilania pasuje do specyfikacji stacji DGX A100 i samego Smart PDU. Zazwyczaj stacja DGX A100 wymaga źródła zasilania, które może dostarczyć od 100 V do 240 V AC, z określonymi ocenami prądu [1] [7].3. Podłączanie urządzeń **
- Podłącz stację DGX A100 z inteligentnym PDU za pomocą odpowiednich kabli zasilania. Systemy DGX A100 wykorzystują przewody zasilające blokujące, aby zapewnić bezpieczeństwo i zgodność [1].- Upewnij się, że wszystkie urządzenia są odpowiednio podłączone i wyłączone przed kontynuowaniem.
4. Łączenie czujników **
- Jeśli Twój inteligentny PDU obsługuje dodatkowe czujniki (np. Czujniki temperatury lub wilgotności), podłącz je zgodnie z instrukcjami producenta. Czujniki te mogą dostarczyć cennych danych środowiskowych do monitorowania i utrzymywania optymalnych warunków pracy [3].5. Konfigurowanie inteligentnego PDU **
- Zaloguj się: Uzyskaj dostęp do interfejsu internetowego Smart PDU za pomocą domyślnych poświadczeń administratora (np. Admin/admin). Zmień te poświadczenia dotyczące bezpieczeństwa [3].- Ustawienia sieci: Skonfiguruj ustawienia sieciowe, aby umożliwić zdalne monitorowanie. Ustaw serwery IP, maskę podsieci, bramę i DNS zgodnie z wymaganiami środowiska sieciowego [6].
- Konta użytkowników: Utwórz nowe konta użytkowników administracyjnych i usuń domyślne konto administratora dla ulepszonego bezpieczeństwa [3].
- Nazwy czujników: Jeśli dotyczy, skonfiguruj nazwy dla dowolnych podłączonych czujników, aby łatwo identyfikować źródła danych [3].
6. Łączenie z siecią **
- Podłącz inteligentny PDU do swojej sieci. Umożliwia to zdalny dostęp do monitorowania i konfiguracji. Upewnij się, że połączenie sieciowe jest stabilne i bezpieczne [3].7. Monitorowanie zużycia energii **
- Użyj interfejsu internetowego Smart PDU lub narzędzi IPMI do monitorowania zużycia energii. PDU może dostarczyć dane w czasie rzeczywistym i historyczne na temat zużycia energii, co jest kluczowe dla zarządzania wydajnością energetyczną i zdolnościami planowania [4].- Aby uzyskać szczegółowe wskaźniki zużycia energii (np. Całkowita energia od zasilania), może być konieczne użycie narzędzi zewnętrznych, takich jak Prometheus lub napływ, aby zbierać i analizować dane w czasie [4].
8. Integracja ze stacją DGX A100 **
- Upewnij się, że stacja DGX A100 jest odpowiednio podłączona do inteligentnego PDU i że wszystkie kable zasilania są bezpiecznie zablokowane na miejscu, aby zapobiec przypadkowym odłączeniom [1].-Użyj narzędzi takich jak NVIDIA DCGM lub „NVIDIA-SMI`, aby w razie potrzeby monitorować zużycie energii specyficzne dla GPU [4].
Postępując zgodnie z tymi krokami, możesz skutecznie skonfigurować inteligentny PDU do monitorowania energii na stacji DGX A100, zapewniając wydajne zarządzanie energią i niezawodność systemu.
Cytaty:
[1] http://cdn.cnetcontent.com/2f/68/2f68888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-System-archite-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca