Інтерфейс контролера управління на борту (BMC) на станції NVIDIA DGX A100 забезпечує комплексний моніторинг температури для різних системних компонентів. Сюди входить моніторинг температури GPU, Dimms пам'яті, процесора, картки дисплея та материнської плати. BMC дозволяє системним адміністраторам віддалено отримати доступ до цих показань температури через безпечний веб-інтерфейс. Цей інтерфейс пропонує детальну інформацію про датчики системи, включаючи історичні графіки та поточні читання для температури, швидкості вентилятора, споживання електроенергії та напруги системи [1] [6].
BMC також підтримує інтерфейси IPMI (інтелектуальний інтерфейс управління платформою), які дозволяють програмному забезпеченню моніторингу автоматично збирати журнали, статистику та показання датчиків без втручання користувача. Це дозволяє постійному моніторингу та керувати тепловими умовами системи, забезпечуючи оптимальну продуктивність та запобігання перегріву проблем [1] [6].
Крім того, BMC забезпечує серійний інтерфейс LAN (SOL), що дозволяє адміністраторам отримати доступ до послідовної консолі системи для управління налаштуваннями BIOS або встановленій операційній системі. Ця можливість віддаленого доступу має вирішальне значення для підтримки здоров'я та продуктивності системи, особливо в середовищах, де фізичний доступ може бути обмежений [1] [6].
Інноваційна система охолодження на основі охолодження станції DGX A100 додатково покращує управління температурою, ефективно обробляючи більш високу температуру компонентів, не вимагаючи технічного обслуговування, наприклад, перевірки рівня води або заправки. Ця конструкція гарантує, що система працює тихо та безпечно в офісних умовах, підтримуючи оптимальні температури для всіх компонентів [1].
Цитати:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[2] https://www.advanced-integration.ae/wp-content/uploads/2022/08/dgx_station_a100_dateseet_ai-webonly.pdf
[3] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/hardware-scifications-station-a100.html
[5] https://www.mdpi.com/1996-1073/14/2/376
[6] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/using-bmc.html
[7] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-usure
[8] https://mcomputers.cz/en/products-and-services/nvidia/dgx-systems/nvidia-dgx-station-a100/