Untuk mengatur Smart Power Distribution Unit (PDU) untuk pemantauan daya pada stasiun NVIDIA DGX A100, ikuti langkah -langkah terperinci ini:
1. Memasang PDU pintar **
- Opsi pemasangan: PDU pintar dapat dipasang baik secara vertikal maupun horizontal di rak. Untuk pemasangan horizontal, pilih titik pemasangan braket yang sesuai untuk memastikan kedalaman yang tepat di dalam rak. Pasang L-braket dengan sekrup dan pasang selungkup ke dalam slot rak, memungkinkan untuk beberapa kemampuan beradaptasi horizontal [3].- Pemasangan vertikal: Gunakan kit pemasangan tombol yang disediakan dengan PDU pintar. Bagikan tombol secara vertikal dan pasang ke PDU sesuai kebutuhan. Pastikan ada cukup izin di bagian atas untuk tombol dipasang ke lubang kunci [3].
2. Menghubungkan ke sumber daya **
- Hubungkan PDU pintar ke sumber daya yang sesuai. Pastikan bahwa sumber daya cocok dengan spesifikasi stasiun DGX A100 dan PDU pintar itu sendiri. Biasanya, stasiun DGX A100 membutuhkan sumber daya yang dapat memasok 100V hingga 240V AC, dengan peringkat arus spesifik [1] [7].3. Perangkat penghubung **
- Sambungkan stasiun DGX A100 ke PDU pintar menggunakan kabel daya yang sesuai. Sistem DGX A100 menggunakan kabel daya pengunci untuk memastikan keamanan dan kepatuhan [1].- Pastikan semua perangkat terhubung dan dimatikan dengan benar sebelum melanjutkan.
4. Sensor Menghubungkan **
- Jika PDU pintar Anda mendukung sensor tambahan (mis., Sensor suhu atau kelembaban), sambungkan sesuai dengan instruksi pabrik. Sensor ini dapat memberikan data lingkungan yang berharga untuk memantau dan mempertahankan kondisi operasi yang optimal [3].5. Mengkonfigurasi PDU Smart **
- Login: Akses antarmuka web PDU pintar menggunakan kredensial administrator default (mis., Admin/Admin). Ubah kredensial ini untuk keamanan [3].- Pengaturan Jaringan: Mengkonfigurasi Pengaturan Jaringan untuk Mengaktifkan Pemantauan Jarak Jauh. Atur Alamat IP, Subnet Mask, Gateway, dan Server DNS sesuai kebutuhan untuk lingkungan jaringan Anda [6].
- Akun Pengguna: Buat akun pengguna administratif baru dan hapus akun admin default untuk keamanan yang ditingkatkan [3].
- Nama Sensor: Jika berlaku, konfigurasikan nama untuk sensor yang terhubung untuk dengan mudah mengidentifikasi sumber data [3].
6. Menghubungkan ke jaringan **
- Hubungkan PDU pintar ke jaringan Anda. Ini memungkinkan akses jarak jauh untuk pemantauan dan konfigurasi. Pastikan koneksi jaringan stabil dan aman [3].7. Konsumsi Daya Pemantauan **
- Gunakan antarmuka web PDU pintar atau alat IPMI untuk memantau konsumsi daya. PDU dapat memberikan data real-time dan historis tentang penggunaan daya, yang sangat penting untuk mengelola efisiensi energi dan kapasitas perencanaan [4].- Untuk metrik konsumsi energi terperinci (mis., Total energi sejak power-on), Anda mungkin perlu menggunakan alat eksternal seperti Prometheus atau influxdb untuk mengumpulkan dan menganalisis data dari waktu ke waktu [4].
8. Mengintegrasikan dengan DGX Station A100 **
- Pastikan bahwa stasiun DGX A100 terhubung dengan benar ke PDU pintar dan bahwa semua kabel daya secara aman dikunci pada tempatnya untuk mencegah pemutusan yang tidak disengaja [1].-Gunakan alat seperti NVIDIA DCGM atau `NVIDIA-SMI` untuk memantau konsumsi daya khusus GPU jika diperlukan [4].
Dengan mengikuti langkah -langkah ini, Anda dapat secara efektif mengatur PDU pintar untuk pemantauan daya di stasiun DGX Anda A100, memastikan manajemen energi yang efisien dan keandalan sistem.
Kutipan:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?149307227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca