Norėdami nustatyti intelektualiojo energijos paskirstymo bloką (PDU), skirtą „NVIDIA DGX Station A100“ stebėjimui, atlikite šiuos išsamius veiksmus:
1. Smartaus PDU ** montavimas
- Montavimo parinktys: „Smart PDU“ gali būti montuojamas vertikaliai arba horizontaliai stelaže. Norėdami gauti horizontalų montavimą, pasirinkite tinkamus laikiklių tvirtinimo taškus, kad užtikrintumėte tinkamą stovo gylį. Pritvirtinkite L-Brackets su varžtais ir įdėkite korpusą į stovo lizdus, leisdami tam tikrą horizontalų pritaikomumą [3].- Vertikalus tvirtinimas: naudokite mygtuko tvirtinimo rinkinį, pateiktą kartu su išmaniuoju PDU. Paskirstykite mygtukus vertikaliai ir pritvirtinkite juos prie PDU, jei reikia. Įsitikinkite, kad viršuje yra pakankamai klirenso, kad mygtukai būtų pritvirtinti prie raktų skylės [3].
2. Prisijungimas prie maitinimo šaltinio **
- Prijunkite išmanųjį PDU prie tinkamo maitinimo šaltinio. Įsitikinkite, kad maitinimo šaltinis atitinka „DGX Station A100“ specifikacijas ir patį „Smart PDU“. Paprastai „DGX Station A100“ reikalauja maitinimo šaltinio, galinčio tiekti nuo 100 V iki 240 V, turint specifinius srovės įvertinimus [1] [7].3. Jungiamieji įrenginiai **
- Prijunkite „DGX Station A100“ prie išmaniojo PDU naudodami atitinkamus maitinimo kabelius. „DGX A100“ sistemos naudoja fiksavimo maitinimo laidus, kad užtikrintų saugumą ir atitiktį [1].- Įsitikinkite, kad visi įrenginiai yra tinkamai prijungti ir išjungti prieš tęsdami.
4. JUNGTINIŲ JUNORŲ PRIEŽIŪRA **
- Jei jūsų išmanusis PDU palaiko papildomus jutiklius (pvz., Temperatūros ar drėgmės jutiklius), prijunkite juos pagal gamintojo instrukcijas. Šie jutikliai gali pateikti vertingų aplinkos duomenų stebėjimui ir optimalioms eksploatavimo sąlygoms stebėti ir palaikyti [3].5. Smart PDU ** konfigūravimas
- Prisijunkite: pasiekite „Smart PDU“ žiniatinklio sąsają naudodami numatytąjį administratoriaus kredencialus (pvz., Administratorius/administratorius). Pakeiskite šiuos saugumo kredencialus [3].- Tinklo nustatymai: sukonfigūruokite tinklo parametrus, kad įjungtumėte nuotolinį stebėjimą. Nustatykite IP adresą, potinklio kaukę, šliuzą ir DNS serverius, jei reikia jūsų tinklo aplinkai [6].
- Vartotojo abonementai: Sukurkite naujas administracines vartotojo abonementus ir pašalinkite numatytąją administratoriaus paskyrą, kad būtų patobulinta sauga [3].
- Jutiklių pavadinimai: jei taikoma, sukonfigūruokite bet kokių prijungtų jutiklių pavadinimus, kad lengvai nustatytumėte duomenų šaltinius [3].
6. Prisijungimas prie tinklo **
- Prijunkite „Smart PDU“ prie savo tinklo. Tai leidžia nuotolinei prieigai stebėjimui ir konfigūracijai. Įsitikinkite, kad tinklo ryšys yra stabilus ir saugus [3].7. Stebėjimo energijos suvartojimas **
- Norėdami stebėti energijos suvartojimą, naudokite „Smart PDU“ žiniatinklio sąsają arba IPMI įrankius. PDU gali pateikti realaus laiko ir istorinius duomenis apie energijos naudojimą, kuris yra labai svarbus energijos vartojimo efektyvumo ir planavimo pajėgumų valdymui [4].- Norėdami gauti išsamią energijos suvartojimo metriką (pvz., Bendra energija nuo įjungimo), norint rinkti ir analizuoti duomenis, gali tekti naudoti išorines priemones, tokias kaip „Prometheus“ ar „InfluxDB“ [4].
8. Integracija į DGX stoties A100 **
- Įsitikinkite, kad DGX stotis A100 yra tinkamai prijungta prie išmaniojo PDU ir kad visi galios kabeliai yra saugiai užrakinti vietoje, kad būtų išvengta atsitiktinių atjungimų [1].-Naudokite tokius įrankius kaip „NVIDIA DCGM“ arba „NVIDIA-SMI“, jei reikia, kad prireikus stebėtų GPU specifinę energijos suvartojimą [4].
Atlikdami šiuos veiksmus, galite efektyviai nustatyti išmanųjį PDU, skirtą energijos stebėjimui jūsų „DGX Station A100“, užtikrindami efektyvų energijos valdymą ir sistemos patikimumą.
Citatos:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architcture-white-paper_publed.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-tation-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-tation-a100-user-guide/getting-started-tation-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca