Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon 设置智能PDU的步骤是什么,用于DGX站A100上


设置智能PDU的步骤是什么,用于DGX站A100上


要在NVIDIA DGX站A100上设置智能配电单元(PDU),以进行电源监视,请按照以下详细的步骤操作:

1。安装智能PDU **

- 安装选项:智能PDU可以垂直或水平安装在机架中。对于水平安装,请选择适当的支架安装点,以确保机架内的适当深度。用螺钉连接L式托架,然后将围栏安装到机架插槽中,从而具有一些水平适应性[3]。
- 垂直安装:使用Smart PDU提供的按钮安装套件。垂直分发按钮,并根据需要将其连接到PDU。确保顶部有足够的间隙,以使按钮安装到钥匙孔中[3]。

2。连接到电源**

- 将智能PDU连接到合适的电源。确保电源匹配DGX站A100和Smart PDU本身的规格。通常,DGX站A100需要一个可以提供100V至240V AC的电源,并具有特定的电流评分[1] [7]。

3。连接设备**

- 使用适当的电源电缆将DGX站A100连接到Smart PDU。 DGX A100系统使用锁定电源线来确保安全和合规性[1]。
- 确保所有设备在继续之前都正确连接并关闭电源。

4。连接传感器**

- 如果您的智能PDU支持其他传感器(例如温度或湿度传感器),请根据制造商的说明将它们连接起来。这些传感器可以提供有价值的环境数据,以监视和维持最佳的工作条件[3]。

5。配置智能PDU **

- 登录:使用默认管理员凭据(例如Admin/Admin)访问Smart PDU的Web界面。将这些凭据更改以进行安全性[3]。
- 网络设置:配置网络设置以启用远程监视。根据您的网络环境需要设置IP地址,子网掩码,网关和DNS服务器[6]。
- 用户帐户:创建新的管理用户帐户,然后删除默认管理帐户以进行增强安全性[3]。
- 传感器名称:如果适用,请为任何连接的传感器配置名称以轻松识别数据源[3]。

6。连接到网络**

- 将智能PDU连接到您的网络。这允许远程访问以监视和配置。确保网络连接稳定且安全[3]。

7。监视功耗**

- 使用Smart PDU的Web界面或IPMI工具来监视功耗。 PDU可以提供有关功率使用的实时和历史数据,这对于管理能源效率和计划能力至关重要[4]。
- 对于详细的能源消耗指标(例如,自加入以来的总能量),您可能需要使用Prometheus或InfluxDB等外部工具来收集和分析数据随着时间的推移[4]。

8。与DGX站A100集成**

- 确保将DGX站A100正确连接到SMART PDU,并确保将所有电源电缆牢固地锁定到位,以防止意外断开连接[1]。
- 使用NVIDIA DCGM或`nvidia-smi'等工具来监视GPU特异性功耗(如果需要)[4]。

通过遵循以下步骤,您可以有效地设置智能PDU,以在DGX站A100上进行电源监视,从而确保有效的能源管理和系统可靠性。

引用:
[1] http://cdn.cnetcontent.com/2f/68/68/2f6888a0-063f-4d76-94e4-8666666b7619dfdf.pdf.pdf
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-system-acystem-architecture-white-white-white-paper_paper_paper_papered.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r/hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=I6NX74LQTCA