Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jaký druh monitorovacích schopností nabízí stanice DGX pro vzdálenou správu


Jaký druh monitorovacích schopností nabízí stanice DGX pro vzdálenou správu


Stanice NVIDIA DGX A100 nabízí robustní monitorovací schopnosti pro vzdálenou správu, zvyšuje jeho použitelnost a efektivitu v oblasti AI a vysoce výkonné výpočetní prostředí. Zde jsou některé z klíčových funkcí:

1. řadič správy základní desky (BMC): Stanice DGX A100 obsahuje vestavěný BMC, který poskytuje webové rozhraní pro vzdálený přístup a ovládání. Toto rozhraní umožňuje uživatelům sledovat různé komponenty systému, včetně teplotních senzorů pro GPU, paměťové DIMM, CPU, zobrazovací kartu a základní desku. Kromě toho sleduje rychlosti ventilátoru, spotřebu energie a napětí systému a zobrazuje historické grafy i aktuální hodnoty [1] [4].

2. Rozhraní IPMI: BMC také podporuje IPMI (Inteligentní rozhraní správy platformy), což umožňuje monitorovacímu softwaru automaticky shromažďovat protokoly, statistiky a odečty senzorů bez zásahu uživatele. IPMI zahrnuje rozhraní sériového přes rozhraní LAN (Sol), což umožňuje přístup k sériové konzole systému pro správu nastavení BIOS nebo nainstalovaného operačního systému [1].

3. Vzdálená schopnost KVM: Webové rozhraní nabízí dálkovou klávesnici, video, video (KVM). To umožňuje uživatelům zobrazit zobrazení systému a spravovat jej z dálky. Funkce KVM také podporuje virtuální úložiště a umožňuje uživatelům připojit vzdálené svazky a provádět úkoly, jako je přeinstalování systému nebo zavedení z obrazu ISO [1].

4. Konsolidace sítě: Stanice A100 DGX může konsolidovat síťová připojení pomocí rozhraní Síťového řadiče (NCSI), což umožňuje spravování jak dálkové správy, tak pravidelné systémové připojení LAN prostřednictvím jediného poklesu sítě. To zjednodušuje nastavení a snižuje počet požadovaných portů [1].

5. Správce stanice DGX: Ačkoli není specifický pro model A100, NVIDIA nabízí nástroje jako DGX Správce stanic pro správu zdrojů napříč více systémy DGX. Tento nástroj umožňuje uživatelům sledovat využití zdrojů, naplánovat úlohy a spravovat oprávnění uživatelů z centralizovaného rozhraní [10].

Celkově poskytuje stanice A100 DGX komplexní možnosti dálkového monitorování a správy, díky čemuž je vhodná pro místní i vzdálená výpočetní prostředí AI.

Citace:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[2] https://nvidianews.nvidia.com/news/nvidia-announces-Dgx-park-and-Dgx-station-to--ai-computers
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/security.html
[5] https://www.nvidia.com/en-us/products/workstations/dgx-station/
[6] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[7] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-researchers-researchers-atata-center-in-rax.html
[8] https://www.pcmag.com/news/what-is-nvidias-dgx-station-a-new-specialized-desktop-line-for-ai-work
[9] https://www.comspecta.com/dgxstation-a100.html
[10] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-cloud-Advantages-configurations and-setup-guide