Pentru a configura o unitate de distribuție a energiei inteligente (PDU) pentru monitorizarea puterii pe stația NVIDIA DGX A100, urmați acești pași detaliate:
1. Montarea PDU inteligentă **
- Opțiuni de montare: PDU inteligent poate fi montat pe verticală sau orizontal într -un suport. Pentru montarea orizontală, selectați puncte de montare corespunzătoare pentru a asigura o adâncime corespunzătoare în raft. Atașați parantezele L cu șuruburi și instalați carcasa în sloturile raftului, permițând o oarecare adaptabilitate orizontală [3].- Montare verticală: Utilizați kitul de montare a butonului prevăzut cu PDU inteligent. Distribuie butoanele pe verticală și atașează -le la PDU, după cum este necesar. Asigurați -vă că există suficientă gardă în partea de sus pentru ca butoanele să se monteze în găuri de taste [3].
2. Conectarea la sursa de alimentare **
- Conectați PDU inteligent la o sursă de alimentare adecvată. Asigurați -vă că sursa de alimentare se potrivește cu specificațiile stației DGX A100 și ale PDU inteligente în sine. De obicei, stația DGX A100 necesită o sursă de energie care poate furniza 100V la 240V AC, cu evaluări de curent specifice [1] [7].####. Dispozitive de conectare **
- Conectați stația DGX A100 la PDU inteligent folosind cablurile de alimentare corespunzătoare. Sistemele DGX A100 folosesc cabluri de alimentare de blocare pentru a asigura siguranța și conformitatea [1].
- Asigurați -vă că toate dispozitivele sunt conectate și oprite corespunzător înainte de a continua.
1. Senzori de conectare **
- Dacă PDU -ul dvs. inteligent acceptă senzori suplimentari (de exemplu, senzori de temperatură sau umiditate), conectați -i în conformitate cu instrucțiunile producătorului. Acești senzori pot furniza date valoroase de mediu pentru monitorizarea și menținerea condițiilor de operare optime [3].5. Configurarea PDU inteligentă **
- Autentificare: Accesați interfața web a PDU inteligentă folosind acreditările implicite de administrator (de exemplu, admin/admin). Schimbați aceste acreditări pentru securitate [3].- Setări de rețea: Configurați setările de rețea pentru a activa monitorizarea la distanță. Setați serverele de adresă IP, mască de subrețea, gateway și DNS, după cum este necesar pentru mediul dvs. de rețea [6].
- Conturi de utilizator: Creați noi conturi de utilizator administrative și eliminați contul de administrare implicit pentru securitate îmbunătățită [3].
- Nume senzor: Dacă este cazul, configurați numele pentru orice senzori conectați pentru a identifica cu ușurință sursele de date [3].
6. Conectarea la rețea **
- Conectați PDU inteligent la rețeaua dvs. Aceasta permite accesul la distanță pentru monitorizare și configurare. Asigurați -vă că conexiunea la rețea este stabilă și sigură [3].7. Monitorizarea consumului de energie **
- Utilizați interfața web SMART PDU sau instrumentele IPMI pentru a monitoriza consumul de energie. PDU poate furniza date istorice în timp real și istorice privind consumul de energie, ceea ce este crucial pentru gestionarea capacității de eficiență energetică și de planificare [4].- Pentru valori detaliate ale consumului de energie (de exemplu, energie totală de la energie electrică), este posibil să fie necesar să utilizați instrumente externe precum Prometeu sau InfluxDB pentru a colecta și analiza datele în timp [4].
8. Integrarea cu stația DGX A100 **
- Asigurați -vă că stația DGX A100 este conectată corespunzător la PDU inteligent și că toate cablurile de alimentare sunt blocate în siguranță pentru a preveni deconecțiile accidentale [1].-Utilizați instrumente precum NVIDIA DCGM sau `NVIDIA-SMI` pentru a monitoriza consumul de energie specific GPU, dacă este necesar [4].
Urmărind acești pași, puteți configura în mod eficient un PDU inteligent pentru monitorizarea puterii pe stația dvs. DGX A100, asigurând gestionarea eficientă a energiei și fiabilitatea sistemului.
Citări:
[1] http://cdn.cnetcontent.com/2f/68/2F6888A0-063F-4D76-94E4-8666B7619DFD.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-tatation-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca