DGX Station A100 jälgib ja kuvab süsteemipingeid oma põrandalauahalduskontrolleri (BMC) kaudu, mis pakub põhjalikku seiresüsteemi. See BMC pakub veebipõhist kasutajaliidest, mis võimaldab kasutajatel turvaliselt juurde pääseda ja üle vaadata andurite näitu, sealhulgas süsteemipingeid, koos muude kriitiliste süsteemimõõdikutega, nagu temperatuur, ventilaatori kiirused ja energiatarve. Nendele funktsioonidele on juurdepääs ka IPMI liideste kaudu, võimaldades automatiseeritud seire ilma kasutaja sekkumiseta.
BMC liides sisaldab nende mõõdikute ajaloolisi graafikuid ja praeguseid näiteid, pakkudes üksikasjalikku ülevaadet süsteemi jõudlusest ja tervisest. See võime on optimaalsete süsteemi tingimuste säilitamiseks ülioluline, eriti keskkonnas, kus stabiilseks tööks on vaja täpset pingekontrolli. Lisaks toetab BMC kaugjuhtimisfunktsioone nagu Serial Over LAN (SOL) ja klaviatuur, video, hiire (KVM) funktsionaalsus, mis võimaldab süsteemi kaugjuhtimist ja tõrkeotsingut.
Üksikasjalikuks jälgimiseks ja analüüsimiseks saavad kasutajad integreerida BMC andmed väliste seireriistade või andmebaasidega, et aja jooksul ajaloolisi andmeid koguda ja analüüsida. See lähenemisviis aitab tuvastada suundumusi ja kõrvalekaldeid süsteemipingetes, mis on hädavajalik DGX -jaama A100 usaldusväärsuse ja tõhususe säilitamiseks.
Kokkuvõtlikult jälgitakse DGX Station A100 süsteemipingeid ja kuvatakse BMC veebiliidese ja IPMI võimaluste kombinatsiooni kaudu, pakkudes süsteemi tõhusaks haldamiseks nii reaalajas kui ka ajaloolisi andmeid.
Tsitaadid:
[1] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[2] https://docs.nvidia.com/dgx/dgx-dation-a100-user-guide/index.html
[3] https://docs.nvidia.com/dgx/pdf/dgx-manth-user-guide.pdf
]
]
]
]
[8] https://www.youtube.com/watch?v=i6nx74lqtca
]
[10] https://nanoporetech.com/document/nvidia-dgx-dation-a100-installation-and-use