Tehnologija MIG (Multi-Instance GPU) bistveno poveča razširljivost postaje NVIDIA DGX A100, tako da omogoča razdelitev posameznih GPU-jev na več, popolnoma izolirane primere. Ta funkcija omogoča postaji DGX, da hkrati podpira več uporabnikov ali skupin, zaradi česar je zelo primeren za sodelovalna okolja ali skupne delovne prostore.
Ključne izboljšave
1. Razdelitev virov: MIG omogoča razdelitev enega samega GPU -ja na kar sedem neodvisnih primerov, vsak s svojim namenskim pomnilnikom, predpomnilnikom in pretakanjem večprocesorja. To zagotavlja, da vsak primer deluje neodvisno, ne da bi se potegoval za vire, s čimer se poveča učinkovitost in izkoriščenost GPU [4] [8].
2. Zajamčena kakovost storitve (QoS): MIG z zagotavljanjem izoliranih virov za vsak primer zagotavlja predvidljivo uspešnost in zajamčene QoS. To je še posebej koristno za izvajanje več delovnih mest hkrati, kot so zahteve za sklepanje AI, ne da bi vplivale na uspešnost sistema [8] [9].
3. Podpora za več uporabnikov: Postaja DGX A100 lahko zagotovi do 28 ločenih primerov GPU, ko so z MIG omogočeni vsi štirje GPU. To več uporabnikom omogoča dostop in uporabo sistema hkrati, zato je idealen za ekipe podatkovnih znanosti in izobraževalne ustanove [2] [7].
4. Prilagodljivost pri uvajanju: MIG podpira različne možnosti uvajanja, vključno z zagonom aplikacij CUDA na golih kovini ali zabojnikih. To fleksibilnost še izboljša z orodjem za vsebnost NVIDIA, ki uporabnikom omogoča, da v primerih GPU-ja zaženejo Cuda-pospešene zabojnike [4] [9].
5. MIG pomaga zmanjšati potrebo po posameznih nastavitvah GPU-ja ali v oblaku. Z omogočanjem več uporabnikov, da učinkovito delijo enake vire GPU-ja. Zaradi tega je postaja DGX stroškovno učinkovita rešitev za organizacije, zlasti v primerjavi z najemom virov GPU v oblaku [1] [5].
Primeri uporabe
- AI usposabljanje in sklepanje: MIG omogoča, da se različni GPU -ji v postaji DGX konfigurirajo za različne delovne obremenitve, kot so AI Training, HPC ali analitika podatkov. Ta prilagodljivost je ključnega pomena za organizacije, ki morajo učinkovito upravljati z različnimi delovnimi obremenitvami AI [4] [10].
- Izobraževalna in raziskovalna okolja: Sposobnost podpore več uporabnikov hkrati naredi postajo DGX še posebej koristno za izobraževalne ustanove in raziskovalne laboratorije, kjer so skupna skupna sredstva [1] [4].
Če povzamemo, tehnologija MIG povečuje razširljivost postaje DGX z zagotavljanjem prilagodljivega, več uporabniškega okolja, ki maksimira uporabo GPU-ja, hkrati pa zagotavlja predvidljivo delovanje. Zaradi tega je postaja DGX idealna platforma za sodelovanje AI raziskav in razvoja v različnih panogah.
Navedbe:
[1] https://www.toolify.ai/ai-news/experience-the-power-of-nvidia-dgx-station-a100-971252
[2] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/sl/nvidia-dgx-station-a100-offers-researchers-ai-nata-Center-in-a-a-box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
[4] https://www.robustthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[5] https://www.eweek.com/big-tata-and-analytics/how-nvidia-a100-station-brings-tata-cent-heft-to-workgroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidiaws.nvidia.com/news/nvidia-dgx-station-a100-offers-researchers-ai-Data-center-in-a-box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-print-dgx-station-a100-taSasheet-us-partner.pdf