توفر واجهة وحدة التحكم في إدارة اللوح (BMC) في محطة NVIDIA DGX A100 مراقبة شاملة لدرجة الحرارة لمختلف مكونات النظام. ويشمل ذلك مراقبة درجات حرارة وحدات معالجة الرسومات ، و Dimms للذاكرة ، و CPU ، وبطاقة العرض ، واللوحة الأم. تتيح BMC لمسؤولي النظام الوصول إلى قراءات درجة الحرارة هذه عن بُعد من خلال واجهة آمنة على الويب. تقدم هذه الواجهة معلومات مفصلة حول أجهزة استشعار النظام ، بما في ذلك الرسوم البيانية التاريخية والقراءات الحالية لدرجات الحرارة وسرعات المروحة واستهلاك الطاقة وفولتية النظام [1] [6].
تدعم BMC أيضًا واجهات IPMI (واجهة إدارة النظام الأساسي الذكي) ، والتي تمكن برامج المراقبة من جمع السجلات والإحصاءات وقراءات المستشعرات تلقائيًا دون تدخل المستخدم. يتيح ذلك المراقبة والإدارة المستمرة للظروف الحرارية للنظام ، مما يضمن الأداء الأمثل ومنع مشكلات ارتفاع درجة الحرارة [1] [6].
بالإضافة إلى ذلك ، توفر BMC واجهة مسلسل عبر LAN (SOL) ، مما يسمح للمسؤولين بالوصول إلى وحدة التحكم التسلسلية للنظام لإدارة إعدادات BIOS أو نظام التشغيل المثبت. تعتبر إمكانية الوصول عن بُعد أمرًا بالغ الأهمية للحفاظ على صحة النظام وأداءه ، خاصة في البيئات التي قد يكون فيها الوصول المادي محدودًا [1] [6].
يعزز نظام التبريد المبتكر القائم على التبريد في محطة DGX A100 إدارة درجة الحرارة من خلال التعامل بكفاءة في درجات حرارة مكونة أعلى دون الحاجة إلى الصيانة ، مثل فحص مستوى المياه أو إعادة التعبئة. يضمن هذا التصميم أن يعمل النظام بهدوء وأمان في بيئات المكاتب ، مع الحفاظ على درجات الحرارة المثلى لجميع المكونات [1].
الاستشهادات:
[1] https://www.robusthpc.com
[2] https://www.advanced-integration.ae/wp-content/uploads/2022/08/dgx_station_a100_datasheet_ai-webonly.pdf
[3]
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/hardware-specifications-station-a100.html
[5] https://www.mdpi.com/1996-1073/14/2/376
[6] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/using-bmc.html
[7] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use
[8] https://mcomputers.cz/en/products-and-services/nvidia/dgx-systems/nvidia-dgx-station-a100/