Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jaké jsou kroky k nastavení inteligentního PDU pro monitorování energie na stanici DGX A100


Jaké jsou kroky k nastavení inteligentního PDU pro monitorování energie na stanici DGX A100


Chcete -li nastavit inteligentní distribuční jednotku (PDU) pro monitorování napájení na stanici NVIDIA DGX A100, postupujte podle těchto podrobných kroků:

1.. Montáž inteligentního pdu **

- Možnosti montáže: Inteligentní PDU lze namontovat svisle nebo vodorovně do stojanu. Pro horizontální montáž vyberte příslušné montážní body držáku, abyste zajistili správnou hloubku v stojanu. Připevněte L-držáky šrouby a nainstalujte kryt do slotů na stojany, což umožňuje určitou vodorovnou přizpůsobivost [3].
- Vertikální montáž: Použijte soupravu pro montáž tlačítka poskytovanou s inteligentním PDU. Rozložte tlačítka svisle a podle potřeby je připojte k PDU. Ujistěte se, že je na vrcholu dostatek vůle, aby se tlačítka připojila do klíčových dílek [3].

2. připojení ke zdroji energie **

- Připojte inteligentní PDU k vhodnému zdroji energie. Zajistěte, aby zdroj energie odpovídal specifikacím stanice DGX A100 a samotného inteligentního PDU. Stanice DGX A100 obvykle vyžaduje zdroj energie, který může dodávat 100V až 240 V AC, se specifickým proudovým hodnocením [1] [7].

3. Připojující zařízení **

- Připojte stanici DGX A100 k inteligentnímu PDU pomocí příslušných napájecích kabelů. Systémy DGX A100 používají k zajištění bezpečnosti a souladu [1].
- Před pokračováním se ujistěte, že všechna zařízení jsou správně připojena a vypnutá.

4. Spojení senzorů **

- Pokud váš inteligentní PDU podporuje další senzory (např. Senzory teploty nebo vlhkosti), připojte je podle pokynů výrobce. Tyto senzory mohou poskytnout cenné údaje o prostředí pro monitorování a udržování optimálních provozních podmínek [3].

5. Konfigurace inteligentního PDU **

- Přihlášení: Přístup k webovému rozhraní Smart PDU pomocí výchozích pověření správce (např. Admin/admin). Změňte tyto přihlašovací údaje za bezpečnost [3].
- Nastavení sítě: Nakonfigurujte nastavení sítě tak, aby povolila vzdálené monitorování. Nastavte IP adresu, masku podsítě, brány a DNS servery podle potřeby pro vaše síťové prostředí [6].
- Uživatelské účty: Vytvořte nové účty administrativního uživatele a odstraňte výchozí účet správce pro zvýšené zabezpečení [3].
- Názvy senzorů: Pokud je to možné, nakonfigurujte názvy pro jakékoli připojené senzory pro snadné identifikaci zdrojů dat [3].

6. Připojení k síti **

- Připojte inteligentní PDU k vaší síti. To umožňuje vzdálený přístup pro monitorování a konfiguraci. Zajistěte, aby síťové připojení bylo stabilní a bezpečné [3].

7. Monitorování spotřeby energie **

- Pomocí webového rozhraní Smart PDU nebo nástrojů IPMI pro sledování spotřeby energie. PDU může poskytnout v reálném čase a historické údaje o využití energie, což je zásadní pro řízení energetické účinnosti a kapacity plánování [4].
- Pro podrobné metriky spotřeby energie (např. Celková energie od zapnutí) možná budete muset použít externí nástroje jako Prometheus nebo InfluxDB pro shromažďování a analýzu dat v průběhu času [4].

8. Integrace do stanice DGX A100 **

- Ujistěte se, že stanice DGX A100 je správně připojena k inteligentnímu PDU a aby všechny napájecí kabely byly bezpečně uzamčeny na místo, aby se zabránilo náhodným odpojením [1].
-Použijte nástroje jako NVIDIA DCGM nebo `NVIDIA-SMI` ke sledování spotřeby energie specifické pro GPU v případě potřeby [4].

Dodržováním těchto kroků můžete efektivně nastavit inteligentní PDU pro monitorování energie na vaší stanici DGX A100 a zajistit efektivní řízení energie a spolehlivost systému.

Citace:
[1] http://cdn.cnetcontent.com/2f/68/2F6888A0-063F-4D76-94E4-8666B7619DFD.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutity_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=I6NX74LQTCA