A MIG (multi-értékű GPU) technológia szignifikánsan javítja az NVIDIA DGX A100 állomás méretezhetőségét azáltal, hogy lehetővé teszi az egyes GPU-k több, teljesen izolált példányra történő megosztását. Ez a szolgáltatás lehetővé teszi a DGX állomás számára, hogy egyszerre támogassa több felhasználót vagy csapatot, így rendkívül alkalmas együttműködési környezetre vagy megosztott munkaterületekre.
Key Enhancements
1. erőforrás -partíció: A MIG lehetővé teszi egyetlen GPU megosztását hét független példányra, mindegyik saját dedikált memóriával, gyorsítótárral és streaming multiprocesszorral. Ez biztosítja, hogy minden példány önállóan működjön, anélkül, hogy az erőforrásokért versenyezne, ezáltal maximalizálva a GPU hatékonyságát és felhasználását [4] [8].
2. Garantált szolgáltatás minősége (QoS): Az egyes példányok izolált erőforrásainak biztosításával a MIG biztosítja a kiszámítható teljesítményt és a garantált QoS -t. Ez különösen előnyös a több feladat egyszerre történő futtatásához, például az AI következtetési kérelmekhez, anélkül, hogy befolyásolná a rendszer teljesítményét [8] [9].
3. Multi-felhasználói támogatás: Az A100 DGX állomás akár 28 különálló GPU példányt is biztosíthat, ha mind a négy GPU engedélyezve van a MIG-vel. Ez lehetővé teszi több felhasználó számára, hogy egyszerre férjen hozzá és használjon a rendszert, így ideális az adattudományi csapatok és az oktatási intézmények számára [2] [7].
4. Rugalmasság a telepítésben: A MIG támogatja a különféle telepítési lehetőségeket, ideértve a CUDA alkalmazások futtatását csupaszfémen vagy konténereken. Ezt a rugalmasságot tovább javítja az NVIDIA Container Toolkit, amely lehetővé teszi a felhasználók számára, hogy a CUDA-gyorsított konténereket a GPU példányokon futtassák [4] [9].
5. Skálázhatóság és költséghatékonyság: Ha több felhasználó lehetővé teszi az azonos GPU-erőforrások hatékony megosztását, a MIG elősegíti az egyes GPU-beállítások vagy a felhő-bérleti díjak szükségességét. Ez teszi a DGX állomást költséghatékony megoldássá a szervezetek számára, különösen, ha a felhő GPU erőforrásainak idővel történő bérlésével összehasonlítva [1] [5].
Használati esetek
- AI képzés és következtetés: A MIG lehetővé teszi a DGX állomás különböző GPU -jának konfigurálását a különböző munkaterhelésekhez, például AI Training, HPC vagy Data Analytics. Ez a rugalmasság elengedhetetlen azoknak a szervezeteknek, amelyeknek a különféle AI munkaterheléseket hatékonyan kell kezelniük [4] [10].
- Oktatási és kutatási környezetek: A több felhasználó egyszerre történő támogatásának képessége a DGX állomást különösen hasznossá teszi az oktatási intézmények és a kutatólaboratóriumok számára, ahol a megosztott források gyakoriak [1] [4].
Összefoglalva: a MIG technológia javítja a DGX állomás méretezhetőségét azáltal, hogy rugalmas, több felhasználói környezetet biztosít, amely maximalizálja a GPU felhasználását, miközben biztosítja a kiszámítható teljesítményt. Ez teszi a DGX állomást ideális platformnak az AI együttműködési kutatásához és fejlesztéséhez a különböző iparágakban.
Idézetek:
[1] https://www.toolify.ai/ai-news/experience-the-power-of-nvidia-dgx-station-a100-971252
[2] https://www.glenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-offers-researchers-Ai-data-center-in-a-box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architecture.pdf
[4] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-chitecture-white-paper_publised.pdf.pdf
[5] https://www.eweek.com/big-data-and-analytics/how-nvidia-a100-station-prings-data-center-heft-to-workGroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-dgx-station-a100-offers-researchers-ai-data-center-in-a--box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf