Per impostare un'unità di distribuzione di alimentazione intelligente (PDU) per il monitoraggio dell'alimentazione sulla stazione NVIDIA DGX A100, seguire questi passaggi dettagliati:
1. Montare la PDU intelligente **
- Opzioni di montaggio: la PDU intelligente può essere montata in verticale o in orizzontale in un rack. Per il montaggio orizzontale, selezionare i punti di montaggio della staffa appropriati per garantire una profondità adeguata all'interno del rack. Collegare le rotte L con viti e installare il contenitore negli slot del rack, consentendo un po 'di adattabilità orizzontale [3].- Montaggio verticale: utilizzare il kit di montaggio del pulsante fornito con la PDU intelligente. Distribuire i pulsanti in verticale e attaccarli alla PDU secondo necessità. Assicurati che ci sia abbastanza spazio nella parte superiore affinché i pulsanti si montino in fori key [3].
2. Collegamento alla fonte di alimentazione **
- Collegare la PDU intelligente a una fonte di alimentazione adatta. Assicurarsi che la fonte di alimentazione corrisponda alle specifiche della stazione DGX A100 e allo stesso PDU intelligente. In genere, la stazione DGX A100 richiede una fonte di alimentazione in grado di fornire da 100 V a 240 V CA, con valutazioni di corrente specifiche [1] [7].3. Dispositivi di collegamento **
- Collegare la stazione DGX A100 alla PDU intelligente utilizzando i cavi di alimentazione appropriati. I sistemi DGX A100 utilizzano cavi di alimentazione di bloccaggio per garantire sicurezza e conformità [1].- Assicurarsi che tutti i dispositivi siano correttamente collegati e speguiti prima di procedere.
4. Sensori di collegamento **
- Se la PDU intelligente supporta ulteriori sensori (ad es. Sensori di temperatura o umidità), collegarli secondo le istruzioni del produttore. Questi sensori possono fornire preziosi dati ambientali per il monitoraggio e il mantenimento di condizioni operative ottimali [3].5. Configurazione della PDU intelligente **
- Accedi: accedere all'interfaccia Web della PDU Smart utilizzando le credenziali di amministratore predefinite (ad es. Admin/Admin). Modifica queste credenziali per la sicurezza [3].- Impostazioni di rete: configurare le impostazioni di rete per abilitare il monitoraggio remoto. Impostare i server IP, Subnet Mask, Gateway e DNS come richiesto per l'ambiente di rete [6].
- Account utente: creare nuovi account utente amministrativi e rimuovere l'account amministratore predefinito per una sicurezza avanzata [3].
- Nomi dei sensori: se applicabile, configurare i nomi per qualsiasi sensori connessi per identificare facilmente le origini dati [3].
6. Connessione alla rete **
- Collega la PDU intelligente alla tua rete. Ciò consente l'accesso remoto per il monitoraggio e la configurazione. Assicurarsi che la connessione di rete sia stabile e sicura [3].7. Monitoraggio del consumo di energia **
- Utilizzare l'interfaccia Web di Smart PDU o gli strumenti IPMI per monitorare il consumo di energia. La PDU può fornire dati in tempo reale e storici sull'uso dell'energia, il che è cruciale per la gestione dell'efficienza energetica e della capacità di pianificazione [4].- Per le metriche dettagliate sul consumo di energia (ad esempio, l'energia totale da Power-On), potrebbe essere necessario utilizzare strumenti esterni come Prometheus o InfluxDB per raccogliere e analizzare i dati nel tempo [4].
8. Integrazione con la stazione DGX A100 **
- Assicurarsi che la stazione DGX A100 sia correttamente collegata alla PDU intelligente e che tutti i cavi di alimentazione siano bloccati saldamente in posizione per prevenire disconnessioni accidentali [1].-Utilizzare strumenti come Nvidia DCGM o `Nvidia-SMI` per monitorare il consumo di energia specifico della GPU se necessario [4].
Seguendo questi passaggi, è possibile impostare efficacemente una PDU intelligente per il monitoraggio dell'alimentazione sulla stazione DGX A100, garantendo una gestione efficiente dell'energia e un'affidabilità del sistema.
Citazioni:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publy.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?149307222222222222222222222222222222722222722222272222722227227227227227272722727272272722722727222727272722272227222722272227222227222222272222222227222222222227 a
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca