สถานี DGX A100 แทร็กและแสดงแรงดันไฟฟ้าของระบบผ่านตัวควบคุมการจัดการ baseboard (BMC) ซึ่งมีระบบตรวจสอบที่ครอบคลุม BMC นี้นำเสนอส่วนต่อประสานผู้ใช้บนเว็บที่ช่วยให้ผู้ใช้สามารถเข้าถึงและตรวจสอบการอ่านเซ็นเซอร์ได้อย่างปลอดภัยรวมถึงแรงดันไฟฟ้าของระบบพร้อมกับตัวชี้วัดระบบที่สำคัญอื่น ๆ เช่นอุณหภูมิความเร็วพัดลมและการใช้พลังงาน คุณสมบัติเหล่านี้ยังสามารถเข้าถึงได้ผ่านอินเตอร์เฟส IPMI ซึ่งเปิดใช้งานการตรวจสอบอัตโนมัติโดยไม่ต้องแทรกแซงผู้ใช้
อินเทอร์เฟซ BMC รวมถึงกราฟประวัติศาสตร์และการอ่านปัจจุบันสำหรับตัวชี้วัดเหล่านี้ให้ภาพรวมโดยละเอียดเกี่ยวกับประสิทธิภาพของระบบและสุขภาพ ความสามารถนี้มีความสำคัญต่อการรักษาเงื่อนไขระบบที่ดีที่สุดโดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่จำเป็นต้องมีการควบคุมแรงดันไฟฟ้าที่แม่นยำสำหรับการทำงานที่มั่นคง นอกจากนี้ BMC ยังรองรับคุณสมบัติการจัดการระยะไกลเช่นอนุกรมเหนือ LAN (SOL) และคีย์บอร์ดวิดีโอวิดีโอเมาส์ (KVM) ช่วยให้สามารถจัดการระบบระยะไกลและการแก้ไขปัญหาได้
สำหรับการติดตามและการวิเคราะห์โดยละเอียดผู้ใช้สามารถรวมข้อมูล BMC เข้ากับเครื่องมือตรวจสอบภายนอกหรือฐานข้อมูลเพื่อรวบรวมและวิเคราะห์ข้อมูลประวัติเมื่อเวลาผ่านไป วิธีการนี้ช่วยในการระบุแนวโน้มและความผิดปกติในแรงดันไฟฟ้าของระบบซึ่งเป็นสิ่งจำเป็นสำหรับการรักษาความน่าเชื่อถือและประสิทธิภาพของสถานี DGX A100
โดยสรุปแรงดันไฟฟ้าของระบบ A100 ของสถานี DGX จะถูกติดตามและแสดงผ่านการรวมกันของเว็บอินเตอร์เฟสและความสามารถของ IPMI ของ BMC ซึ่งให้ข้อมูลทั้งแบบเรียลไทม์และประวัติศาสตร์สำหรับการจัดการระบบที่มีประสิทธิภาพ
การอ้างอิง:
[1] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[2] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[6] https://www.megware.com/fileadmin/user_upload/landingpage%20nvidia/nvidia-ampere-architecture-whitepaper.pdf
[7] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[8] https://www.youtube.com/watch?v=I6NX74LQTCA
[9] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use