Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hogyan kezeli a DGX állomás több felhasználót és távoli hozzáférést


Hogyan kezeli a DGX állomás több felhasználót és távoli hozzáférést


Az NVIDIA DGX Station A100 -at úgy tervezték, hogy hatékonyan kezelje a több felhasználót és a távoli hozzáférést, így ideális megoldást jelent az adattudományi csapatok és szervezetek számára, amelyek központosított AI erőforrásokat igényelnek. Így kezeli ezeket a képességeket:

Több felhasználó kezelése

- Multi-instance GPU (MIG): A DGX állomás A100 támogatja a MIG-t, amely lehetővé teszi, hogy akár 28 különálló GPU-eszköz legyen kiosztva az egyes felhasználóknak vagy munkahelyeknek. Ez azt jelenti, hogy több felhasználó egyszerre oszthatja meg ugyanazt a GPU -t anélkül, hogy befolyásolná a rendszer teljesítményét. A MIG lehetővé teszi az egyes GPU -példányok számára, hogy saját memóriával, gyorsítótárával és streaming multiprocesszorral rendelkezzenek, biztosítva a hatékony erőforrás -felhasználást [1] [2].

- Párhuzamos munkaterhelések: A rendszer képes az edzés, a következtetések és az elemzések munkaterhelésére párhuzamosan futtatni. Ez lehetővé teszi több felhasználó számára, hogy egyszerre dolgozzon a különböző projektekben, kihasználva a négy összekapcsolt NVIDIA A100 GPU teljes potenciálját [1] [4].

- Erőforrás -megosztás: A MIG elősegíti az erőforrás -megosztást több felhasználó, például a hallgatók vagy az adattudományi csapatok tagjai között. Ez a szolgáltatás különösen hasznos a többszörös következtetési feladatok értékeléséhez vagy a Jupyter notebookok használatához a modellkutatáshoz [2].

Távoli hozzáférés és menedzsment

- Távoli menedzsment: Az A100 DGX állomás robusztus távoli kezelési képességeket kínál. A felhasználók távolról távolról kezelhetik a rendszert egy webes interfész segítségével, amely részletes rendszernaplókat, érzékelői leolvasást és teljesítményfigyelést biztosít. Ez magában foglalja a GPU -k, a memória DIMM -ek, a CPU és más komponensek hőmérséklet -megfigyelését [2].

- IPMI és KVM: A rendszer támogatja az IPMI -t (intelligens platformkezelő interfész) az automatizált megfigyeléshez és a kezeléshez. Ezenkívül KVM (billentyűzet, videó, egér) funkciót kínál, lehetővé téve a felhasználók számára, hogy távolról hozzáférjenek a rendszer kijelzőjéhez, és úgy kezeljék, mintha fizikailag jelen lennének. Ez magában foglalja a virtuális tárolási képességeket a rendszer távoli indításához vagy újratelepítéséhez [2].

- Biztonságos protokollok: A biztonságos protokollok, mint például az SSH, beállíthatók, hogy lehetővé tegyék a DGX állomáshoz való távoli hozzáférést a különböző gépekből. Ez lehetővé teszi a felhasználók számára, hogy bárhonnan rugalmasan kezeljék AI -munkaterheléseiket [5].

-NVIDIA rendszerkezelő felület: A felhasználók felhasználhatják az NVIDIA System Management Interface (NVIDIA-SMI) parancssori eszközt a GPU teljesítményének megfigyelésére és kezelésére, ideértve a felhasználási százalékokat és a hőmérsékleti értékeket [5].

Összességében az A100 DGX állomás hatékony, irodabarát megoldást kínál több felhasználó és távoli hozzáférés számára, így különféle környezetekhez, a vállalati irodáktól a kutatási létesítményekig.

Idézetek:
[1] https://www.compecta.com/dgxstation-a100.html
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-chitecture-white-paper_publised.pdf.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf
[5] https://www.fiibermall.com/blog/nvidia-dgx-systems.htm
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7] https://www.techpowerup.com/forums/threads/nvidia-announdes-dgx-park-and-dgx-station-personal-ai-computers.334300/
[8] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-cloud-advantages-configurations-andetup-guide