Če želite nastaviti pametno enoto za distribucijo električne energije (PDU) za spremljanje moči na postaji NVIDIA DGX postaje A100, sledite tem podrobnim korakom:
1. Montaža pametnega PDU **
- Možnosti pritrditve: Pametni PDU je mogoče namestiti navpično ali vodoravno v stojalo. Za vodoravno pritrditev izberite ustrezne točke pritrditve nosilca, da zagotovite pravilno globino znotraj stojala. L-vijake pritrdite z vijaki in namestite ohišje v reže stojala, kar omogoča nekaj horizontalne prilagodljivosti [3].- Navpična pritrditev: Uporabite komplet za pritrditev gumba, ki je priložen pametnemu PDU. Gumbe razdelite navpično in jih po potrebi pritrdite na PDU. Prepričajte se, da je na vrhu dovolj odmika, da se gumbi pritrdijo v ključavnice [3].
2. Povezava z virom napajanja **
- Smart PDU povežite z ustreznim virom napajanja. Prepričajte se, da se vir napajanja ujema s specifikacijami postaje DGX A100 in pametnega PDU -ja. Običajno postaja DGX postaja A100 vir napajanja, ki lahko napaja od 100 V do 240 V AC, s specifičnimi trenutnimi ocenami [1] [7].3. Povezovanje naprav **
- Priključite postajo DGX A100 na pametni PDU z ustreznimi napajalnimi kabli. Sistemi DGX A100 uporabljajo zaklepne napajalne kable za zagotovitev varnosti in skladnosti [1].- Prepričajte se, da so vse naprave pravilno povezane in izklopljene pred nadaljevanjem.
4. Povezovanje senzorjev **
- Če vaš pametni PDU podpira dodatne senzorje (npr. Senzorji temperature ali vlažnosti), jih povežite v skladu z navodili proizvajalca. Ti senzorji lahko nudijo dragocene okoljske podatke za spremljanje in vzdrževanje optimalnih delovnih pogojev [3].5. Konfiguriranje pametnega PDU **
- Prijava: dostopajte do spletnega vmesnika Smart PDU s privzetimi skrbniškimi poverilnicami (npr. Admin/Admin). Spremenite te poverilnice za varnost [3].- Nastavitve omrežja: Konfigurirajte omrežne nastavitve, da omogočite oddaljeno spremljanje. Nastavite IP naslov, masko podomrežja, prehod in strežnike DNS, kot je potrebno za vaše omrežno okolje [6].
- Uporabniški računi: ustvarite nove upravne uporabniške račune in odstranite privzeti skrbniški račun za izboljšano varnost [3].
- Imena senzorjev: Če je primerno, konfigurirajte imena za vse povezane senzorje, da enostavno prepoznate vire podatkov [3].
6. Povezava z omrežjem **
- Smart PDU povežite z omrežjem. To omogoča oddaljeni dostop za spremljanje in konfiguracijo. Prepričajte se, da je omrežna povezava stabilna in varna [3].7. Spremljanje porabe energije **
- Za spremljanje porabe energije uporabite spletni vmesnik Smart PDU ali orodja IPMI. PDU lahko zagotovi realni čas in zgodovinske podatke o porabi električne energije, kar je ključnega pomena za upravljanje energetske učinkovitosti in zmogljivosti načrtovanja [4].- Za podrobne meritve porabe energije (npr. Skupno energijo od vklopa) boste morda morali za zbiranje in analizo podatkov sčasoma uporabiti zunanja orodja, kot sta Prometheus ali InfluxDB [4].
8. Vključevanje s postajo DGX A100 **
- Prepričajte se, da je DGX postaja A100 pravilno povezana s pametnim PDU in da so vsi napajalni kabli varno zaklenjeni na svoje mesto, da se prepreči naključna odklop [1].-Uporabite orodja, kot sta NVIDIA DCGM ali `NVIDIA-SMI`, če je potrebno spremljanje porabe energije, specifične za GPU [4].
Z upoštevanjem teh korakov lahko učinkovito nastavite pametni PDU za spremljanje električne energije na vaši postaji A100 DGX in tako zagotovite učinkovito upravljanje z energijo in zanesljivost sistema.
Navedbe:
[1] http://cdn.cnetcontent.com/2f/68/2f688A0-063f-4d76-94e4-866b7619dfd.pdf
[2] https://www.robustthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?149307227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-start-station-a100.html
[8] https://www.youtube.com/watch?v=I6NX74LQTCA