A interface do controlador de gerenciamento de rodapé (BMC) na estação DGX NVIDIA A100 fornece monitoramento abrangente de temperatura para vários componentes do sistema. Isso inclui o monitoramento das temperaturas das GPUs, DIMMs de memória, CPU, cartão de exibição e placa -mãe. O BMC permite que os administradores do sistema acessem essas leituras de temperatura remotamente através de uma interface segura baseada na Web. Essa interface oferece informações detalhadas sobre os sensores do sistema, incluindo gráficos históricos e leituras atuais para temperaturas, velocidades do ventilador, consumo de energia e tensões do sistema [1] [6].
O BMC também suporta interfaces IPMI (Intelligent Platform Management Interface), que permitem que o software de monitoramento colete logs, estatísticas e leituras de sensores automaticamente sem intervenção do usuário. Isso permite o monitoramento e o gerenciamento contínuos das condições térmicas do sistema, garantindo o desempenho ideal e impedindo problemas de superaquecimento [1] [6].
Além disso, o BMC fornece uma interface serial sobre LAN (SOL), permitindo que os administradores acessem o console serial do sistema para gerenciar as configurações do BIOS ou o sistema operacional instalado. Essa capacidade de acesso remoto é crucial para manter a saúde e o desempenho do sistema, especialmente em ambientes onde o acesso físico pode ser limitado [1] [6].
O inovador sistema de refrigeração baseado em refrigeração da Estação DGX A100 aumenta ainda mais o gerenciamento da temperatura, lidando com temperaturas mais altas de componentes com eficiência sem exigir manutenção, como verificações ou recargas no nível da água. Esse design garante que o sistema opere silenciosamente e com segurança em ambientes de escritório, mantendo temperaturas ideais para todos os componentes [1].
Citações:
[1] https://www.robuthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[2] https://www.advanced-integration.ae/wp-content/uploads/2022/08/dgx_station_a100_dataheet_ai-webonly.pdf
[3] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/hardware-specifications-station-a100.html
[5] https://www.mdpi.com/1996-1073/14/2/376
[6] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/using-bmc.html
[7] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use
[8] https://mcomputers.cz/en/products-and-services/nvidia/dgx-systems/nvidia-dgx-station-a100/