Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon DGX 스테이션 A100에서 시스템 전압이 추적 및 표시되는 방법


DGX 스테이션 A100에서 시스템 전압이 추적 및 표시되는 방법


DGX 스테이션 A100은 포괄적 인 모니터링 시스템을 제공하는 BMC (Baseboard Management Controller)를 통해 시스템 전압을 추적하고 표시합니다. 이 BMC는 웹 기반 사용자 인터페이스를 제공하여 사용자가 온도, 팬 속도 및 전력 소비와 같은 다른 중요한 시스템 메트릭과 함께 시스템 전압을 포함한 센서 판독 값에 안전하게 액세스하고 검토 할 수 있습니다. 이러한 기능은 IPMI 인터페이스를 통해 액세스 할 수 있으므로 사용자 개입없이 자동 모니터링을 가능하게합니다.

BMC 인터페이스에는 이러한 메트릭에 대한 과거 그래프 및 현재 판독 값이 포함되어있어 시스템 성능 및 건강에 대한 자세한 개요를 제공합니다. 이 기능은 특히 안정적인 작동에 정확한 전압 제어가 필요한 환경에서 최적의 시스템 조건을 유지하는 데 중요합니다. 또한 BMC는 LAN (SOL) 및 키보드, 비디오, 마우스 (KVM) 기능과 같은 원격 관리 기능을 지원하여 원격 시스템 관리 및 문제 해결이 가능합니다.

자세한 추적 및 분석을 위해 사용자는 BMC 데이터를 외부 모니터링 도구 또는 데이터베이스와 통합하여 시간이 지남에 따라 과거 데이터를 수집하고 분석 할 수 있습니다. 이 접근법은 시스템 전압의 추세와 이상을 식별하는 데 도움이되며, 이는 DGX 스테이션 A100의 신뢰성과 효율성을 유지하는 데 필수적입니다.

요약하면 DGX 스테이션 A100의 시스템 전압은 BMC의 웹 인터페이스와 IPMI 기능의 조합을 통해 추적 및 표시되며 효과적인 시스템 관리를위한 실시간 및 과거 데이터를 모두 제공합니다.

인용 :
[1] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[2] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[6] https://www.megware.com/fileadmin/user_upload/landingpage%20nvidia/nvidia-ampere-architection-whitepaper.pdf
[7] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architection--paper_published.pdf
[8] https://www.youtube.com/watch?v=i6nx74lqtca
[9] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-installation-and-use