يوفر نظام Nvidia DGX Station A100 قدرات مراقبة شاملة تتجاوز درجة الحرارة. جنبا إلى جنب مع مراقبة درجة الحرارة ل GPU و DIMMS الذاكرة ووحدة المعالجة المركزية وبطاقة العرض والوحة الأم ، يتتبع النظام أيضًا العديد من المكونات المهمة ومقاييس الأداء الأخرى. وتشمل هذه:
- سرعات المروحة: يراقب النظام سرعة المشجعين لضمان تماثل تدفق الهواء وكفاءة التبريد الأمثل ، وهو أمر بالغ الأهمية للحفاظ على الأداء ومنع ارتفاع درجة الحرارة.
- استهلاك الطاقة: يساعد مراقبة استهلاك الطاقة في إدارة استخدام الطاقة وضمان عمل النظام ضمن حدود آمنة. هذا مهم بشكل خاص لنظام مصمم ليتم استخدامه في بيئات المكاتب دون بنية تحتية متخصصة للطاقة.
- فولتية النظام: مراقبة الجهد ضرورية للحفاظ على تشغيل النظام المستقر. يساعد في اكتشاف أي تقلبات الجهد يمكن أن تؤثر على أداء النظام أو طول العمر.
يمكن الوصول إلى إمكانيات المراقبة هذه من خلال واجهة مستخدم قائمة على الويب وواجهة IPMI (واجهة إدارة النظام الأساسي الذكي). توفر واجهة الويب الرسوم البيانية التاريخية والقراءات الحالية لهذه المقاييس ، مما يسمح بتحليل تفصيلي وإدارة أداء النظام. بالإضافة إلى ذلك ، يدعم النظام ميزات الإدارة عن بُعد ، بما في ذلك المسلسل عبر LAN (SOL) للوصول إلى وحدة التحكم التسلسلية ولوحة المفاتيح البعيدة والفيديو والماوس (KVM) لإدارة النظام من مسافة [1].
الاستشهادات:
[1] https://www.robusthpc.com
[2] https://www.horizoniq.com/blog/nvidia-a100-specs/
[3] https://www.redbooks.ibm.com/redpapers/pdfs/redp5688.pdf
[4] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduction-to-dgxa100.html
[5] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[6] https://www.pny.com/en-eu/fileدس
[7]
[8] https://docs.nvidia.com/dgx/pdf/dgxa100-user-guide.pdf
[9] https://www.compecta.com/dgxstation-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-station-a100-installation-and-use