Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Как технология MIG повышает масштабируемость станции DGX


Как технология MIG повышает масштабируемость станции DGX


Технология MIG (мульти-инстанция GPU) значительно повышает масштабируемость станции NVIDIA DGX A100, позволяя разделить отдельные графические процессоры в множественные, полностью изолированные случаи. Эта функция позволяет станции DGX одновременно поддерживать нескольких пользователей или команд, что делает ее очень подходящей для совместной среды или общих рабочих мест.

Улучшения ключей

1. Разделение ресурсов: MIG позволяет разделение одного графического процессора на целых семь независимых экземпляров, каждый со своей собственной специальной памятью, кэшем и потоковым многопроцессором. Это гарантирует, что каждый экземпляр работает независимо, не конкурируя за ресурсы, тем самым максимизируя эффективность и использование графического процессора [4] [8].

2. Гарантированное качество обслуживания (QoS): предоставляя изолированные ресурсы для каждого экземпляра, MIG обеспечивает предсказуемую производительность и гарантированную QoS. Это особенно полезно для выполнения нескольких заданий одновременно, таких как запросы на вывод AI, без влияния на производительность системы [8] [9].

3. Многопользовательская поддержка: Станция DGX A100 может обеспечить до 28 отдельных экземпляров графического процессора, когда все четыре графических процессора включены с MIG. Это позволяет нескольким пользователям получить доступ и использовать систему одновременно, что делает ее идеальным для групп по науке о данных и учебных заведениях [2] [7].

4. Гибкость в развертывании: MIG поддерживает различные варианты развертывания, включая запуск приложений CUDA на обнаженных металлах или контейнерах. Эта гибкость дополнительно повышается с помощью инструментария контейнера NVIDIA, который позволяет пользователям запускать контейнеры с ускорением CUDA на экземплярах GPU [4] [9].

5. Масштабируемость и экономическая эффективность: позволяя нескольким пользователям эффективно делиться одними и теми же ресурсами графического процессора, MIG помогает снизить потребность в отдельных настройках графических процессоров или аренде облаков. Это делает станцию ​​DGX экономически эффективным решением для организаций, особенно по сравнению с арендой ресурсов облачных графических процессоров с течением времени [1] [5].

варианты использования

- Обучение и вывод ИИ: MIG позволяет настраивать различные графические процессоры на станции DGX для различных рабочих нагрузок, таких как обучение AI, HPC или аналитика данных. Эта гибкость имеет решающее значение для организаций, которым необходимо эффективно управлять различными рабочими нагрузками ИИ [4] [10].

- Образовательная и исследовательская среда: способность одновременно поддерживать нескольких пользователей делает станцию ​​DGX особенно полезной для образовательных учреждений и исследовательских лабораторий, где общие ресурсы являются общими [1] [4].

Таким образом, технология MIG повышает масштабируемость станции DGX, предоставляя гибкую многопользовательскую среду, которая максимизирует использование GPU, обеспечивая при этом предсказуемую производительность. Это делает станцию ​​DGX идеальной платформой для совместных исследований и разработок ИИ в различных отраслях.

Цитаты:
[1] https://www.toolify.ai/ai-news/experience-the-power-of-nvidia-dgx-station-a100-971252
[2] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-researchers-ai-data-center-in-box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-centter/nvidia-ampere-architecture-whitepaper.pdf
[4] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[5] https://www.eweek.com/big-data-and-analytics/how-nvidia-a100-station-rings-data-center-heft-to-workgroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-dgx-station-a100-offers-researchers-ai-data-center-in-abox
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf