Lai iestatītu viedās jaudas sadales bloku (PDU) enerģijas uzraudzībai NVIDIA DGX stacijā A100, izpildiet šos detalizētos pasākumus:
1. Montāžas viedā PDU **
- Montāžas iespējas: viedo PDU var uzstādīt vertikāli vai horizontāli plauktā. Horizontālai stiprināšanai atlasiet piemērotus kronšteina stiprināšanas punktus, lai nodrošinātu pareizu dziļumu plauktā. Pievienojiet L-Brackets ar skrūvēm un uzstādiet korpusu statīva slotos, ļaujot veikt kādu horizontālu pielāgojamību [3].- Vertikālā montāža: izmantojiet pogu stiprināšanas komplektu, kas nodrošināts ar Smart PDU. Izplatiet pogas vertikāli un pēc vajadzības pievienojiet tās PDU. Pārliecinieties, ka augšpusē ir pietiekami daudz klīrensa, lai pogas varētu uzstādīt atslēgas caurumos [3].
2. savienojums ar strāvas avotu **
- Pievienojiet viedo PDU ar piemērotu enerģijas avotu. Pārliecinieties, ka strāvas avots atbilst DGX stacijas A100 un paša viedā PDU specifikācijām. Parasti DGX stacijai A100 ir nepieciešams strāvas avots, kas var piegādāt no 100 V līdz 240 V maiņstrāvai ar īpašiem strāvas vērtējumiem [1] [7].3. savienošanas ierīču **
- Pievienojiet DGX staciju A100 ar Smart PDU, izmantojot atbilstošos strāvas kabeļus. DGX A100 sistēmas izmanto bloķēšanas barošanas vadus, lai nodrošinātu drošību un atbilstību [1].- Pārliecinieties, ka visas ierīces ir pareizi savienotas un ieslēgtas pirms turpināšanas.
4. savienojošie sensori **
- Ja jūsu viedais PDU atbalsta papildu sensorus (piemēram, temperatūras vai mitruma sensorus), savienojiet tos atbilstoši ražotāja norādījumiem. Šie sensori var sniegt vērtīgus vides datus optimālu darbības apstākļu uzraudzībai un uzturēšanai [3].5. Smart PDU ** konfigurēšana
- Pieteikšanās: piekļūstiet Smart PDU tīmekļa saskarnei, izmantojot noklusējuma administratora akreditācijas datus (piemēram, admin/admin). Mainiet šos drošības akreditācijas datus [3].- Tīkla iestatījumi: konfigurējiet tīkla iestatījumus, lai iespējotu attālo uzraudzību. Iestatiet IP adresi, apakštīkla masku, vārteju un DNS serverus, kā nepieciešams jūsu tīkla videi [6].
- Lietotāju konti: izveidojiet jaunus administratīvos lietotāja kontus un noņemiet noklusējuma administratora kontu uzlabotai drošībai [3].
- Sensoru nosaukumi: ja piemērojams, konfigurējiet visus savienotos sensorus, lai viegli identificētu datu avotus [3].
6. savienojums ar tīklu **
- Savienojiet viedo PDU ar savu tīklu. Tas ļauj attālinātai piekļuvei uzraudzībai un konfigurēšanai. Pārliecinieties, ka tīkla savienojums ir stabils un drošs [3].7. Monitoringa enerģijas patēriņš **
- Lai uzraudzītu enerģijas patēriņu, izmantojiet Smart PDU tīmekļa saskarni vai IPMI rīkus. PDU var sniegt reāllaika un vēsturiskus datus par enerģijas izmantošanu, kas ir būtiska energoefektivitātes un plānošanas spēju pārvaldīšanai [4].- Lai iegūtu detalizētus enerģijas patēriņa metrikus (piemēram, kopējo enerģiju kopš ieslēgšanas), jums, iespējams, būs jāizmanto ārējie rīki, piemēram, Prometheus vai InfluxDB, lai savāktu un analizētu datus laika gaitā [4].
8. Integrēšana ar DGX staciju A100 **
- Pārliecinieties, ka DGX stacija A100 ir pareizi savienota ar Smart PDU un vai visi jaudas kabeļi ir droši nofiksēti vietā, lai novērstu nejaušas atvienošanās [1].-Izmantojiet tādus rīkus kā NVIDIA DCGM vai `NVIDIA-SMI`, lai vajadzības gadījumā uzraudzītu GPU specifisko enerģijas patēriņu [4].
Veicot šīs darbības, jūs varat efektīvi iestatīt viedo PDU enerģijas uzraudzībai savā DGX stacijā A100, nodrošinot efektīvu enerģijas pārvaldību un sistēmas uzticamību.
Atsauces:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publeS.pdf
.
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_engergy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca