Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Comment la station DGX gère-t-elle plusieurs utilisateurs et un accès à distance


Comment la station DGX gère-t-elle plusieurs utilisateurs et un accès à distance


La station NVIDIA DGX A100 est conçue pour gérer efficacement plusieurs utilisateurs et un accès à distance, ce qui en fait une solution idéale pour les équipes et les organisations de la science des données nécessitant des ressources centralisées d'IA. Voici comment il gère ces capacités:

Gestion de plusieurs utilisateurs

- GPU multi-instance (MIG): La station DGX A100 prend en charge MIG, qui permet à 28 appareils GPU séparés d'être alloués à des utilisateurs ou à des travaux individuels. Cela signifie que plusieurs utilisateurs peuvent partager simultanément le même GPU sans impact sur les performances du système. MIG permet à chaque instance GPU d'avoir sa propre mémoire, son cache et son multiprocesseur en streaming, assurant une utilisation efficace des ressources [1] [2].

- Charges de travail parallèles: le système est capable d'exécuter des charges de travail de formation, d'inférence et d'analyse en parallèle. Cela permet à plusieurs utilisateurs de travailler simultanément sur différents projets, en tirant parti de tout le potentiel des quatre GPU NVIDIA A100 [1] [4].

- Partage des ressources: MIG facilite le partage des ressources entre plusieurs utilisateurs, tels que les étudiants ou les membres des équipes de science des données. Cette fonctionnalité est particulièrement utile pour évaluer plusieurs travaux d'inférence ou utiliser des ordinateurs portables Jupyter pour l'exploration du modèle [2].

Accès à distance et gestion

- Gestion à distance: la station DGX A100 offre des capacités de gestion à distance robustes. Les utilisateurs peuvent gérer le système à distance à l'aide d'une interface Web qui fournit des journaux système détaillés, des lectures de capteurs et une surveillance des performances. Cela comprend la surveillance de la température des GPU, des DIMM de mémoire, du CPU et d'autres composants [2].

- IPMI et KVM: le système prend en charge IPMI (interface de gestion de plate-forme intelligente) pour la surveillance et la gestion automatisées. De plus, il offre une fonctionnalité KVM (clavier, vidéo, souris), permettant aux utilisateurs d'accéder à distance à l'affichage du système et de le gérer comme s'ils étaient physiquement présents. Cela inclut les capacités de stockage virtuelles pour le démarrage à distance ou la réinstallation du système [2].

- Protocoles sécurisés: les protocoles sécurisés comme SSH peuvent être configurés pour activer l'accès à distance à la station DGX à partir de différentes machines. Cela permet aux utilisateurs de gérer leurs charges de travail d'IA de manière flexible de n'importe où [5].

- Interface de gestion du système NVIDIA: les utilisateurs peuvent utiliser l'outil de commande de la gestion de la gestion du système NVIDIA (NVIDIA-SMI) pour surveiller et gérer les performances du GPU, y compris les pourcentages d'utilisation et les valeurs de température [5].

Dans l'ensemble, la station DGX A100 fournit une solution puissante et adaptée aux bureaux pour plusieurs utilisateurs et un accès à distance, ce qui le rend adapté à une variété d'environnements, des bureaux d'entreprise aux installations de recherche.

Citations:
[1] https://www.compecta.com/dgxstation-a100.html
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-startner.pdf
[5] https://www.fibermall.com/blog/nvidia-dgx-systems.htm
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-sersonal-ai-supercomputers
[7] https://www.techpowerup.com/forums/threads/nvidia-announs-dgx-spark-and-dgx-station-personal-ai-computers.334300/
[8] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-coud-advantages-configurations-and-setup-guide