Technológia MIG (viacerých inštancií GPU) významne zvyšuje škálovateľnosť stanice NVIDIA DGX A100 tým, že umožní rozdelenie jednotlivých GPU do viacerých, plne izolovaných inštancií. Táto funkcia umožňuje stanici DGX na podporu viacerých používateľov alebo tímov súčasne, vďaka čomu je veľmi vhodná pre spoluprácu alebo zdieľané pracovné priestory.
Kľúčové vylepšenia
1. Rozdelenie zdrojov: MIG umožňuje rozdelenie jedného GPU do siedmich nezávislých inštancií, z ktorých každá má vlastnú špecializovanú pamäť, vyrovnávaciu pamäť a streamovanie multiprocesora. To zaisťuje, že každá inštancia funguje nezávisle bez konkurencie o zdroje, čím maximalizuje efektívnosť a využitie GPU [4] [8].
2. Zaručená kvalita služieb (QoS): Poskytnutím izolovaných zdrojov pre každú inštanciu MIG zaisťuje predvídateľný výkon a zaručený QoS. To je obzvlášť prospešné pre splnenie viacerých pracovných miest súčasne, ako napríklad žiadosti o inferenciu AI, bez ovplyvnenia výkonu systému [8] [9].
3. Podpora viacerých používateľov: Stanica DGX A100 môže poskytnúť až 28 samostatných inštancií GPU, keď sú všetky štyri GPU povolené s MIG. To umožňuje viacerým používateľom prístup k systému a využívať súčasne, vďaka čomu je ideálny pre tímy vedy o údajoch a vzdelávacie inštitúcie [2] [7].
4. Flexibilita pri nasadení: MIG podporuje rôzne možnosti nasadenia vrátane spustenia aplikácií CUDA na holých kovových alebo kontajneroch. Táto flexibilita je ďalej vylepšená nástrojom NVIDIA Container Toolkit, ktorá umožňuje používateľom spúšťať kontajnery akcelerované CUDA v inštanciách GPU [4] [9].
5. Škálovateľnosť a nákladová efektívnosť: Povolením viacerým používateľom zdieľať rovnaké zdroje GPU efektívne pomáha MIG znižovať potrebu individuálnych nastavení GPU alebo cloudových prenájmov. Vďaka tomu je stanica DGX nákladovo efektívne riešenie pre organizácie, najmä v porovnaní s prenájmom cloudových zdrojov GPU v priebehu času [1] [5].
Prípady použitia
- Tréning a inferencia AI: MIG umožňuje konfiguráciu rôznych GPU v stanici DGX pre rôzne pracovné zaťaženie, ako je výcvik AI, HPC alebo analýza údajov. Táto flexibilita je rozhodujúca pre organizácie, ktoré musia efektívne riadiť rôzne pracovné zaťaženie AI [4] [10].
- Vzdelávacie a výskumné prostredia: Schopnosť podporovať viacerých používateľov súčasne robí stanicu DGX obzvlášť prospešná pre vzdelávacie inštitúcie a výskumné laboratóriá, kde sú spoločné zdieľané zdroje [1] [4].
Stručne povedané, technológia MIG zvyšuje škálovateľnosť stanice DGX poskytovaním flexibilného prostredia viacerých používateľov, ktoré maximalizuje využitie GPU a zároveň zabezpečuje predvídateľný výkon. Vďaka tomu je stanica DGX ideálnou platformou pre spoluprácu pre výskum a vývoj AI v rôznych odvetviach.
Citácie:
[1] https://www.tooolify.ai/ai-news/experience-the-power-of-nvidia-dgx-tation-ation-ation-a100-971252
Https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-sation-a100-offers-researchers-aiars-ai-ai-ata-center--box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architutec-witepaper.pdf
Https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-tation-ation-a100-System-architutec-hite-paper_published.pdf
[5] https://www.eweek.com/big-data-and-analytics/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-dgx-tation-a100-fferers-researchers-ai-ata-tata-center-in-in-box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architurt.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-tation-ation-a100-datashet-us-us-partner.pdf