Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kako postaja DGX upravlja več uporabnikov in daljinski dostop


Kako postaja DGX upravlja več uporabnikov in daljinski dostop


Postaja NVIDIA DGX A100 je zasnovana tako, da učinkovito obvlada več uporabnikov in oddaljenega dostopa, zaradi česar je idealna rešitev za ekipe podatkov in organizacije, ki zahtevajo centralizirane vire AI. Tukaj je, kako upravlja s temi zmogljivostmi:

Ravnanje z več uporabniki

- Multi-Instance GPU (MIG): postaja DGX A100 podpira MIG, ki omogoča dodeljevanje do 28 ločenih naprav GPU posameznim uporabnikom ali delovnim mestom. To pomeni, da lahko več uporabnikov hkrati deli isti GPU, ne da bi vplivali na uspešnost sistema. MIG omogoča, da ima vsak primer GPU svoj pomnilnik, predpomnilnik in pretakanje večprocesorja, kar zagotavlja učinkovito izkoriščanje virov [1] [2].

- Vzporedne delovne obremenitve: Sistem je sposoben vzporedno izvajati usposabljanje, sklepanje in analitično delovno obremenitev. To več uporabnikom omogoča, da hkrati delajo na različnih projektih, kar izkorišča celoten potencial štirih medsebojno povezanih NVIDIA A100 GPU [1] [4].

- Skupna raba virov: MIG olajša izmenjavo virov med več uporabniki, kot so študenti ali člani podatkovnih skupin. Ta funkcija je še posebej uporabna za ocenjevanje več opravil za sklepanje ali uporabo prenosnikov Jupyter za raziskovanje modela [2].

daljinski dostop in upravljanje

- Upravljanje na daljavo: DGX Station A100 ponuja robustne zmogljivosti za daljinsko upravljanje. Uporabniki lahko upravljajo sistem z daljave s pomočjo spletnega vmesnika, ki ponuja podrobne sistemske dnevnike, odčitke senzorjev in spremljanje zmogljivosti. To vključuje spremljanje temperature GPU -jev, pomnilnika, CPU in drugih komponent [2].

- IPMI in KVM: Sistem podpira IPMI (Intelligent Platforme Management Interface) za samodejno spremljanje in upravljanje. Poleg tega ponuja funkcionalnost KVM (tipkovnice, video, miška), ki uporabnikom omogoča, da na daljavo dostopajo do zaslona sistema in ga upravljajo, kot da so fizično prisotni. To vključuje virtualne zmogljivosti za shranjevanje za oddaljeno zagon ali ponovno namestitev sistema [2].

- Varni protokoli: Varne protokole, kot je SSH, lahko nastavite tako, da omogočite oddaljeni dostop do postaje DGX iz različnih strojev. To uporabnikom omogoča, da fleksibilno upravljajo svoje delovne obremenitve AI od koder koli [5].

-Vmesnik za upravljanje sistema NVIDIA: Uporabniki lahko za spremljanje in upravljanje zmogljivosti GPU-ja uporabijo orodja ukazne vrstice za upravljanje sistema NVIDIA (NVIDIA-SMI), vključno z odstotki uporabe in temperaturnimi vrednostmi [5].

Na splošno DGX Station A100 ponuja močno, prijazno rešitev za več uporabnikov in oddaljeni dostop, zaradi česar je primerna za različna okolja, od korporativnih pisarn do raziskovalnih objektov.

Navedbe:
[1] https://www.compecta.com/dgxStation-a100.html
[2] https://www.robustthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://www.e4company.com/wp-content/uploads/dgx-family-print-print-dgx-station-a100-tasheet-us-partner.pdf
[5] https://www.fibermall.com/blog/nvidia-dgx-systems.htm
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-aa-superračunalnik
[7] https://www.techpowerup.com/forums/threads/nvidia-announces-dgx-park-and-dgx-station-peral-ai-computers.334300/
[8] https://www.serversimmply.com/blog/how-to-connect-to-nvidia-dgx-cloud-advantages-configurations-in-setup-guide