NVIDIA DGX Station A100 er designet til effektivt at håndtere flere brugere og fjernadgang, hvilket gør det til en ideel løsning for datavidenskabsteams og organisationer, der kræver centraliserede AI -ressourcer. Sådan styrer det disse muligheder:
Håndtering af flere brugere
- GPU (Multi-Instance GPU (MIG): DGX-stationen A100 understøtter MiG, der gør det muligt at tildeles op til 28 separate GPU-enheder til individuelle brugere eller job. Dette betyder, at flere brugere kan dele den samme GPU samtidigt uden at påvirke systemets ydelse. MIG gør det muligt for hver GPU -forekomst at have sin egen hukommelse, cache og streaming multiprocessor, hvilket sikrer effektiv ressourceudnyttelse [1] [2].
- Parallelle arbejdsbelastninger: Systemet er i stand til at køre træning, inferens og analyse arbejdsbelastning parallelt. Dette giver flere brugere mulighed for at arbejde på forskellige projekter samtidigt ved at udnytte det fulde potentiale for de fire sammenkoblede NVIDIA A100 GPU'er [1] [4].
- Ressourcedeling: MIG letter ressourcedeling blandt flere brugere, såsom studerende eller medlemmer af Data Science -teams. Denne funktion er især nyttig til evaluering af flere inferensjob eller ved hjælp af Jupyter -notesbøger til modeludforskning [2].
Fjernadgang og styring
- Fjernstyring: DGX Station A100 tilbyder robuste fjernstyringsfunktioner. Brugere kan administrere systemet på afstand ved hjælp af en webbaseret grænseflade, der indeholder detaljerede systemlogfiler, sensorlæsninger og præstationsovervågning. Dette inkluderer temperaturovervågning af GPU'er, hukommelsesdimms, CPU og andre komponenter [2].
- IPMI og KVM: Systemet understøtter IPMI (Intelligent Platform Management Interface) til automatiseret overvågning og styring. Derudover tilbyder det KVM (tastatur, video, mus) funktionalitet, hvilket giver brugerne mulighed for fjernt at få adgang til systemets display og administrere det, som om de var fysisk til stede. Dette inkluderer virtuelle lagringsfunktioner til fjernstart eller geninstallation af systemet [2].
- Sikre protokoller: Sikre protokoller som SSH kan indstilles for at aktivere fjernadgang til DGX -stationen fra forskellige maskiner. Dette giver brugerne mulighed for at administrere deres AI -arbejdsbelastning fleksibelt overalt [5].
-NVIDIA System Management Interface: Brugere kan bruge NVIDIA System Management Interface (NVIDIA-SMI) kommandolinjeværktøj til at overvåge og styre GPU-ydelse, herunder brugsprocent og temperaturværdier [5].
Generelt giver DGX-stationen A100 en kraftfuld, kontorvenlig løsning til flere brugere og fjernadgang, hvilket gør den velegnet til forskellige miljøer, fra virksomhedskontorer til forskningsfaciliteter.
Citater:
[1] https://www.compecta.com/dgxstation-a100.html
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publiceret.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf
[5] https://www.fibermall.com/blog/nvidia-dgx-systems.htm
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-i-supercomputers
)
[8] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-cloud-advantages-configuration-and-setup-guide