Technologie MIG (Multi-Instance GPU) významně zvyšuje škálovatelnost stanice NVIDIA DGX A100 umožněním rozdělení jednotlivých GPU do několika, plně izolovaných instancí. Tato funkce umožňuje stanici DGX podporovat více uživatelů nebo týmů současně, takže je vysoce vhodná pro prostředí pro spolupráci nebo sdílené pracovní prostory.
Klíčová vylepšení
1. Oddíl zdrojů: MIG umožňuje rozdělení jediného GPU do až sedmi nezávislých instancí, z nichž každá má vlastní vyhrazenou paměť, mezipaměť a streamování multiprocesoru. Tím je zajištěno, že každá instance pracuje nezávisle, aniž by soupeřila o zdroje, čímž maximalizovala účinnost a využití GPU [4] [8].
2. Zaručená kvalita služeb (QoS): Poskytováním izolovaných zdrojů pro každý případ zajišťuje MIG předvídatelný výkon a zaručený QoS. To je obzvláště výhodné pro provozování více pracovních míst současně, jako jsou požadavky na inference AI, aniž by dopadly na výkon systému [8] [9].
3. Podpora více uživatelů: Stanice DGX A100 může poskytnout až 28 samostatných instancí GPU, když jsou všechny čtyři GPU povoleny pomocí MIG. To umožňuje více uživatelům přístup a využívat systém současně, což je ideální pro týmy vědy o datech a vzdělávací instituce [2] [7].
4. Flexibilita při nasazení: MIG podporuje různé možnosti nasazení, včetně spuštění aplikací CUDA na holé kovové nebo kontejnerech. Tato flexibilita je dále vylepšena kontejnerovou sadou NVIDIA, která umožňuje uživatelům provozovat kontejnery CUDA v instancích GPU [4] [9].
5. Škálovatelnost a efektivita nákladů: Umožněním více uživatelům efektivně sdílet stejné zdroje GPU, MIG pomáhá snížit potřebu jednotlivých nastavení GPU nebo pronájem cloudu. Díky tomu je stanice DGX nákladově efektivní řešení pro organizace, zejména ve srovnání s pronájem cloudových zdrojů GPU v průběhu času [1] [5].
Případy použití
- Školení a inference AI: MIG umožňuje nakonfigurovat různé GPU ve stanici DGX pro různá pracovní zátěž, jako je školení AI, HPC nebo analytika dat. Tato flexibilita je zásadní pro organizace, které potřebují efektivně spravovat rozmanitá pracovní zátěž AI [4] [10].
- Vzdělávací a výzkumná prostředí: Schopnost podporovat více uživatelů současně činí stanici DGX obzvláště prospěšnou pro vzdělávací instituce a výzkumné laboratoře, kde jsou společné sdílené zdroje [1] [4].
Stručně řečeno, technologie MIG zvyšuje škálovatelnost stanice DGX poskytnutím flexibilního prostředí pro více uživatelů, které maximalizuje využití GPU a zároveň zajišťuje předvídatelný výkon. Díky tomu je stanice DGX ideální platformou pro spolupráci a vývoj AI v různých průmyslových odvětvích.
Citace:
[1] https://www.toolify.ai/ai-news/experience-the-copower-of-nvidia-Dgx-A100-971252
[2] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-researchers-atata-center-in-rax.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
[4] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[5] https://www.eweek.com/big-data-and-analytics/how-nvidia-a100-station-brings-data-cefto-workgroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-Dgx-station-a100 --researchers-aidata-center-in-a-box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.comspecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf