لإعداد وحدة توزيع الطاقة الذكية (PDU) لمراقبة الطاقة على محطة NVIDIA DGX A100 ، اتبع هذه الخطوات التفصيلية:
1. تركيب PDU الذكية **
- خيارات التثبيت: يمكن تركيب PDU الذكية إما رأسياً أو أفقياً في رف. للتركيب الأفقي ، حدد نقاط تركيب الأقواس المناسبة لضمان العمق المناسب داخل الرف. قم بتوصيل مقاطع L مع مسامير وقم بتثبيت العلبة في فتحات الرف ، مما يسمح ببعض القدرة على التكيف الأفقي [3].- التثبيت الرأسي: استخدم مجموعة تركيب الأزرار المتوفرة مع PDU الذكية. توزيع الأزرار عموديا وإرفاقها على PDU حسب الحاجة. تأكد من وجود خلوص كافٍ في الجزء العلوي لتركيب الأزرار في فتحات المفاتيح [3].
2. الاتصال بمصدر الطاقة **
- قم بتوصيل PDU الذكي بمصدر طاقة مناسب. تأكد من أن مصدر الطاقة يطابق مواصفات محطة DGX A100 و PDU الذكية نفسها. عادةً ما تتطلب محطة DGX A100 مصدرًا للطاقة يمكنه توفير 100 فولت إلى 240 فولت AC ، مع تصنيفات تيار محددة [1] [7].3. توصيل الأجهزة **
- قم بتوصيل محطة DGX A100 بـ PDU الذكية باستخدام كابلات الطاقة المناسبة. تستخدم أنظمة DGX A100 حبال الطاقة لضمان السلامة والامتثال [1].- تأكد من توصيل جميع الأجهزة بشكل صحيح وتشغيله قبل المتابعة.
4. استشعار التوصيل **
- إذا كانت PDU الذكية تدعم أجهزة استشعار إضافية (على سبيل المثال ، أجهزة استشعار درجة الحرارة أو الرطوبة) ، قم بتوصيلها وفقًا لتعليمات الشركة المصنعة. يمكن أن توفر هذه المستشعرات بيانات بيئية قيمة لمراقبة والحفاظ على ظروف التشغيل المثلى [3].5. تكوين PDU الذكي **
- تسجيل الدخول: الوصول إلى واجهة الويب الذكية PDU باستخدام بيانات اعتماد المسؤول الافتراضية (على سبيل المثال ، المسؤول/المسؤول). تغيير بيانات الاعتماد هذه للأمن [3].- إعدادات الشبكة: قم بتكوين إعدادات الشبكة لتمكين المراقبة عن بُعد. قم بتعيين عنوان IP وقناع الشبكة الفرعية والبوابة و DNS على النحو المطلوب لبيئة الشبكة الخاصة بك [6].
- حسابات المستخدم: إنشاء حسابات مستخدم إدارية جديدة وإزالة حساب المسؤول الافتراضي للأمان المحسن [3].
- أسماء المستشعرات: إن أمكن ، قم بتكوين أسماء لأي مستشعرات متصلة لتحديد مصادر البيانات بسهولة [3].
6. الاتصال بالشبكة **
- قم بتوصيل PDU الذكية بشبكتك. هذا يتيح الوصول عن بُعد للمراقبة والتكوين. تأكد من أن اتصال الشبكة مستقر وآمن [3].7. مراقبة استهلاك الطاقة **
- استخدم واجهة ويب Smart PDU أو أدوات IPMI لمراقبة استهلاك الطاقة. يمكن لـ PDU توفير بيانات في الوقت الفعلي والتاريخية حول استخدام الطاقة ، وهو أمر بالغ الأهمية لإدارة كفاءة الطاقة وقدرة التخطيط [4].- للحصول على مقاييس استهلاك الطاقة التفصيلية (على سبيل المثال ، إجمالي الطاقة منذ الطاقة) ، قد تحتاج إلى استخدام أدوات خارجية مثل Prometheus أو influxDB لجمع البيانات وتحليلها بمرور الوقت [4].
8. دمج مع محطة DGX A100 **
- تأكد من توصيل محطة DGX A100 بشكل صحيح بـ PDU الذكي وأن جميع كابلات الطاقة مغلقة بشكل آمن لمنع الانقطاعات العرضية [1].-استخدم أدوات مثل NVIDIA DCGM أو `nvidia-SMI` لمراقبة استهلاك الطاقة الخاصة بمعالجة GPU إذا لزم الأمر [4].
من خلال اتباع هذه الخطوات ، يمكنك إعداد PDU الذكي بشكل فعال لمراقبة الطاقة على محطة DGX A100 ، مما يضمن إدارة الطاقة الفعالة وموثوقية النظام.
الاستشهادات:
[1]
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_ppublish.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf؟149307227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch؟v=i6nx74lqtca