Az intelligens energiaelosztó egység (PDU) beállításához az NVIDIA DGX A100 állomáson az energiafigyeléshez kövesse ezeket a részletes lépéseket:
1. Az intelligens pdu felszerelése **
- Szerelési lehetőségek: Az intelligens PDU függőlegesen vagy vízszintesen rögzíthető egy állványba. A vízszintes rögzítéshez válassza ki a megfelelő zárójel -rögzítési pontokat, hogy biztosítsa a megfelelő mélységet az állványon belül. Csatlakoztassa az L-tartalmakat csavarokkal, és szerelje be a házat az állványhelyekbe, lehetővé téve a vízszintes alkalmazkodóképességet [3].- Függőleges rögzítés: Használja az intelligens PDU -val ellátott gomb szerelőkészletet. Ossza el a gombokat függőlegesen, és szükség szerint rögzítse a PDU -hoz. Győződjön meg arról, hogy van -e elegendő távolság a tetején ahhoz, hogy a gombok a kulcslyukba szereljenek [3].
2. Csatlakozás az áramforráshoz **
- Csatlakoztassa az intelligens PDU -t egy megfelelő áramforráshoz. Győződjön meg arról, hogy az áramforrás megegyezik az A100 DGX állomás és maga az intelligens PDU specifikációival. Általában az A100 DGX állomáshoz olyan energiaforrást igényel, amely 100 V - 240 V AC -t képes ellátni, specifikus áramértékeléssel [1] [7].3. Csatlakozó eszközök **
- Csatlakoztassa az A100 DGX állomást az intelligens PDU -hoz a megfelelő tápkábelek segítségével. A DGX A100 rendszerek reteszelő tápkábeleket használnak a biztonság és a megfelelés biztosítása érdekében [1].- Győződjön meg arról, hogy minden eszközt megfelelően csatlakoztatják és kikapcsolják a folytatás előtt.
4. Csatlakozó érzékelők **
- Ha az intelligens PDU támogatja a további érzékelőket (például hőmérsékletet vagy páratartalom -érzékelőket), csatlakoztassa azokat a gyártó utasításai szerint. Ezek az érzékelők értékes környezeti adatokat szolgáltathatnak az optimális működési feltételek megfigyelésére és fenntartására [3].5. Az intelligens PDU konfigurálása **
- Bejelentkezés: Hozzáférés az intelligens PDU webes felületéhez az alapértelmezett rendszergazdai hitelesítő adatok (például admin/admin) segítségével. Változtassa meg ezeket a hitelesítő adatokat a biztonság érdekében [3].- Hálózati beállítások: Konfigurálja a hálózati beállításokat a távoli megfigyelés engedélyezéséhez. Állítsa be az IP -címet, az alhálózati maszkot, az átjárót és a DNS -kiszolgálókat a hálózati környezethez szükséges módon [6].
- Felhasználói fiókok: Hozzon létre új adminisztratív felhasználói fiókokat, és távolítsa el az alapértelmezett adminisztrációs fiókot a továbbfejlesztett biztonsághoz [3].
- Érzékelőnevek: Ha alkalmazható, konfigurálja a csatlakoztatott érzékelők nevét az adatforrások egyszerű azonosításához [3].
6. Csatlakozás a hálózathoz **
- Csatlakoztassa az intelligens PDU -t a hálózatához. Ez lehetővé teszi a távoli hozzáférést a megfigyeléshez és a konfigurációhoz. Győződjön meg arról, hogy a hálózati kapcsolat stabil és biztonságos [3].7. Az energiafogyasztás megfigyelése **
- Használja az intelligens PDU webes felületét vagy az IPMI eszközöket az energiafogyasztás ellenőrzéséhez. A PDU valós idejű és történelmi adatokat szolgáltathat az energiafelhasználásról, ami elengedhetetlen az energiahatékonyság és a tervezési kapacitás kezeléséhez [4].- A részletes energiafogyasztási mutatókhoz (például a teljes energia a bekapcsolás óta) esetleg külső eszközöket kell használnia, mint például a Prometheus vagy az InfluxDB az adatok összegyűjtéséhez és elemzéséhez [4].
8. Integrálás az A100 DGX állomáshoz **
- Győződjön meg arról, hogy az A100 DGX állomás megfelelően van csatlakoztatva az intelligens PDU -hoz, és hogy az összes tápkábel biztonságosan rögzítse a helyére, hogy megakadályozza a véletlenszerű leválasztást [1].-Használjon olyan eszközöket, mint az NVIDIA DCGM vagy az „NVIDIA-SMI” a GPU-specifikus energiafogyasztás figyelemmel kísérésére [4].
Ezeknek a lépéseknek a követésével hatékonyan beállíthat egy intelligens PDU -t az energiafigyeléshez az A100 DGX állomáson, biztosítva a hatékony energiagazdálkodást és a rendszer megbízhatóságát.
Idézetek:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-8666b7619dfd.pdf.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-chitecture-white-paper_publised.pdf.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-ala-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca