NVIDIA DGX站A100上的远程KVM(键盘,视频,鼠标)功能是远程管理的强大工具,使用户可以访问和控制系统,就好像它们在物理上一样。此功能是底板管理控制器(BMC)的一部分,并提供了一个安全的基于Web的接口,用于监视系统组件,管理BIOS设置以及执行诸如从远程ISO映像启动的任务[1] [9]。
###与其他远程管理工具进行比较
1。基于软件的远程访问工具(例如RDP,VNC):**
- 优点:这些工具通常是免费的或低成本的,不需要其他硬件,并且易于管理。它们适用于服务器更少且服务较少的小型组织[4]。
- 缺点:他们可以与其他应用程序竞争系统资源,缺乏生物验证级别的访问权限,并构成安全风险,如果没有适当的安全性[4]。
2。KVM开关:**
- 优点:KVM开关提供了BIOS级别的访问,这对于故障排除和维护系统至关重要。它们是可靠和安全的,使其非常适合管理关键基础设施[4]。
- 缺点:KVM开关需要其他硬件,并且可能很昂贵,尤其是对于大规模部署而言。他们还需要单独的电源和接口模块[4]。
3。ssh连接:**
- 优点:SSH提供对系统的安全命令行访问,从而有效地管理不需要图形接口的任务。它得到了广泛的支持且易于使用[5]。
- 缺点:SSH缺少KVM提供的图形接口和生物级级别访问,从而将其实用程序限制为需要与系统直接视觉交互的任务[5]。
DGX站A100远程KVM的独特功能
- 虚拟存储:KVM功能包括虚拟存储功能,使用户能够安装远程量并从ISO映像中引导,这对于系统恢复或恢复特别有用[1]。
- 单个网络连接:DGX站A100允许通过单个网络下降来管理远程管理和常规网络连接,简化设置并减少基础架构需求[1]。
- 多现实GPU(MIG):虽然与KVM无直接相关,但DGX站A100支持MIG,最多可将多达28个单独的GPU设备分配给不同的用户或工作,从而增强了资源利用率和灵活性[2]。
总而言之,DGX站A100上的远程KVM功能提供了一种综合的远程管理解决方案,将直接系统访问的好处与基于Web的界面的便利性结合在一起。它特别适合安全和易于管理至关重要的环境,例如在AI研发和开发团队中。
引用:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-system-achitection-architecture-white-phite-white-paper_paper_paper_paper_paubled.pdf
[2] https://www.compecta.com/dgxstation-a100.html
[3] http://nvidianews.nvidia.com/news/nvidia-dgx-station-a100-finders-researchers-researchers-researchers-ai-ai-data-center-in-a-a-box
[4] https://www.raritan.com/blog/detail/kvm-switches-vs.-software基于remote-access-tools
[5] http://cdn.cnetcontent.com/2f/68/68/2f6888a0-063f-4d76-94e4-8666666b7619dfdf.pdf.pdf
[6] https://www.fibermall.com/blog/nvidia-dgx-systems.htm
[7] https://www.fujitsu.com/au/products/computing/servers/supercomputer/gpu-computing/nvidia-dgx-systems/dgx-station/
[8] https://docs.nvidia.com/dgx/dgx-station-user-guide/index.html
[9] https://docs.nvidia.com/dgx/dgx-station-a100-a100-user-guide/using-bmc.html
[10] https://www.exxactcorp.com/nvidia-dgxs-2040d-p2cmi00-e139465748