NVIDIA DGX Station A100 süsteem pakub põhjalikke jälgimisvõimalusi väljaspool temperatuuri. Lisaks GPU -de, mälu DIMM -ide, CPU, Disple -Card ja Emaplaadi temperatuuri jälgimisele jälgib süsteem ka mitmeid muid kriitilisi komponente ja jõudlusmõõdikuid. Nende hulka kuulub:
- Ventilaatori kiirused: süsteem jälgib ventilaatorite kiirust, et tagada optimaalne õhuvoolu ja jahutuse efektiivsus, mis on jõudluse säilitamiseks ja ülekuumenemise vältimiseks ülioluline.
- energiatarve: energiatarbimise jälgimine aitab hallata energiatarbimist ja tagada, et süsteem toimib ohututes piirides. See on eriti oluline süsteemi jaoks, mis on kavandatud kasutamiseks kontorikeskkonnas ilma spetsialiseeritud elektriinfrastruktuurita.
- Süsteemi pinged: Stabiilse süsteemi töö säilitamiseks on hädavajalik pinge jälgimine. See aitab tuvastada mis tahes pingekõikumisi, mis võivad mõjutada süsteemi jõudlust või pikaealisust.
Nendele jälgimisvõimalustele pääseb juurde veebipõhise kasutajaliidese ja IPMI (intelligentse platvormihaldusliidese) liideste kaudu. Veebiliides pakub nende mõõdikute jaoks ajaloolisi graafikuid ja praeguseid näiteid, võimaldades süsteemi jõudluse üksikasjalikku analüüsi ja haldamist. Lisaks toetab süsteem kaugjuhtimisfunktsioone, sealhulgas seeria LAN (SOL) jadakonsooli ja kaugklaviatuuri, video, hiire (KVM) võimaluste juurde pääsemiseks süsteemi haldamiseks eemalt [1].
Tsitaadid:
]
[2] https://www.horizoniq.com/blog/nvidia-a100-pecs/
[3] https://www.redbooks.ibm.com/redpapers/pdfs/redp5688.pdf
]
[5] https://docs.nvidia.com/dgx/pdf/dgx-mass-a100-user-guide.pdf
]
[7] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[8] https://docs.nvidia.com/dgx/pdf/dgxa100-user-guide.pdf
[9] https://www.compeca.com/dgxstation-a100.html
[10] https://nanoporetech.com/document/nvidia-dgx-dation-a100-installation-and-use