MIG (Multi-Instance GPU) 기술은 개별 GPU를 여러 개의 완전히 고립 된 인스턴스로 분할 할 수있게함으로써 NVIDIA DGX 스테이션 A100의 확장 성을 크게 향상시킵니다. 이 기능을 통해 DGX 스테이션은 여러 사용자 또는 팀을 동시에 지원할 수 있으므로 협업 환경 또는 공유 작업 공간에 매우 적합합니다.
키 향상
1. 리소스 파티셔닝 : MIG를 사용하면 단일 GPU를 각각 고유 한 메모리, 캐시 및 스트리밍 멀티 프로세서를 갖춘 7 개의 독립적 인 인스턴스로 단일 GPU를 분할 할 수 있습니다. 이를 통해 각 인스턴스는 리소스와 경쟁하지 않고 독립적으로 작동하여 GPU 효율과 활용을 극대화합니다 [4] [8].
2. 보장 된 서비스 품질 (QOS) : 각 인스턴스에 대해 격리 된 리소스를 제공함으로써 MIG는 예측 가능한 성능을 보장하고 QOS를 보장합니다. 이는 시스템 성능에 영향을 미치지 않으면 서 AI 추론 요청과 같은 여러 작업을 동시에 운영하는 데 특히 유리합니다 [8] [9].
3. 다중 사용자 지원 : DGX 스테이션 A100은 4 개의 GPU 모두 MIG로 활성화 될 때 최대 28 개의 별도 GPU 인스턴스를 제공 할 수 있습니다. 이를 통해 여러 사용자가 시스템에 동시에 액세스하고 활용하여 데이터 과학 팀 및 교육 기관에 이상적입니다 [2] [7].
4. 배포의 유연성 : MIG는 베어 메탈 또는 컨테이너에서 CUDA 응용 프로그램 실행을 포함하여 다양한 배포 옵션을 지원합니다. 이러한 유연성은 NVIDIA 컨테이너 툴킷에 의해 더욱 향상되며,이를 통해 사용자는 GPU 인스턴스에서 CUDA에 액세스 된 컨테이너를 실행할 수 있습니다 [4] [9].
5. 확장 성 및 비용 효율성 : 여러 사용자가 동일한 GPU 리소스를 효율적으로 공유 할 수있게함으로써 MIG는 개별 GPU 설정 또는 클라우드 대여의 필요성을 줄입니다. 이로 인해 DGX 스테이션은 특히 시간이 지남에 따라 클라우드 GPU 자원을 임대하는 것과 비교할 때 조직을위한 비용 효율적인 솔루션이됩니다 [1] [5].
사용 사례
-AI 교육 및 추론 : MIG를 사용하면 DGX 스테이션의 다른 GPU가 AI 교육, HPC 또는 데이터 분석과 같은 다른 워크로드에 대해 구성 할 수 있습니다. 이러한 유연성은 다양한 AI 워크로드를 효율적으로 관리 해야하는 조직에 중요합니다 [4] [10].
- 교육 및 연구 환경 : 여러 사용자를 동시에 지원하는 능력은 DGX 스테이션을 특히 교육 기관 및 연구 실험실에 특히 유익하게 만듭니다 [1] [4].
요약하면 MIG 기술은 GPU 사용을 극대화하면서 예측 가능한 성능을 보장하는 유연한 다중 사용자 환경을 제공하여 DGX 스테이션의 확장 성을 향상시킵니다. 이로 인해 DGX 스테이션은 다양한 산업 분야의 협업 AI 연구 및 개발을위한 이상적인 플랫폼입니다.
인용 :
[1] https://www.toolify.ai/ai-news/experience-the-power-of-nvidia-dgx- 스테이션 -100-971252
[2] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-fopers-researchers-ai-data-center-in-a-box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
[4] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architection--paper_published.pdf
[5] https://www.eweek.com/big-data-and-analytics/how-nvidia-a100-station--rings--data-center-beft-to-workgroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-dgx-station-fon-offers-researchers-ai-data-center-in-a-box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf