Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon DGXステーションA100で電力監視のためにスマートPDUを設定するための手順は何ですか


DGXステーションA100で電力監視のためにスマートPDUを設定するための手順は何ですか


NVIDIA DGXステーションA100で電力監視のためにスマート配電ユニット(PDU)をセットアップするには、これらの詳細な手順に従ってください。

1。スマートpdu **の取り付け

- 取り付けオプション:スマートPDUは、ラックに垂直または水平に取り付けることができます。水平マウントの場合、適切なブラケットマウントポイントを選択して、ラック内の適切な深さを確保します。 L-ブラケットをネジで取り付け、エンクロージャーをラックスロットに取り付け、水平方向の適応性を可能にします[3]。
- 垂直マウント:スマートPDUで提供されたボタンマウントキットを使用します。ボタンを垂直に配布し、必要に応じてPDUに取り付けます。ボタンがキーホールに取り付けるのに十分なクリアランスが上部にあることを確認します[3]。

2。電源への接続**

- スマートPDUを適切な電源に接続します。電源がDGXステーションA100とスマートPDU自体の仕様と一致することを確認してください。通常、DGXステーションA100には、特定の現在の評価で100Vから240V ACを供給できる電源が必要です[1] [7]。

3。デバイスの接続**

-DGXステーションA100を適切な電源ケーブルを使用してスマートPDUに接続します。 DGX A100システムは、ロックパワーコードを使用して、安全性とコンプライアンスを確保しています[1]。
- すべてのデバイスが適切に接続され、進行する前に電源が切れていることを確認してください。

4。センサーの接続**

- スマートPDUが追加のセンサー(温度センサーや湿度センサーなど)をサポートしている場合は、メーカーの指示に従って接続します。これらのセンサーは、最適な動作条件を監視および維持するための貴重な環境データを提供できます[3]。

5。スマートPDUの構成**

- ログイン:デフォルトの管理者資格情報(管理者/管理者など)を使用して、スマートPDUのWebインターフェイスにアクセスします。セキュリティのためにこれらの資格情報を変更します[3]。
- ネットワーク設定:ネットワーク設定を構成して、リモート監視を有効にします。ネットワーク環境に必要なIPアドレス、サブネットマスク、ゲートウェイ、およびDNSサーバーを設定します[6]。
- ユーザーアカウント:新しい管理ユーザーアカウントを作成し、デフォルトの管理者アカウントを削除してセキュリティを強化します[3]。
- センサー名:該当する場合は、接続されたセンサーの名前を構成して、データソースを簡単に識別します[3]。

6。ネットワークへの接続**

- スマートPDUをネットワークに接続します。これにより、監視と構成のリモートアクセスが可能になります。ネットワーク接続が安定して安全であることを確認します[3]。

7。消費電力の監視**

-Smart PDUのWebインターフェイスまたはIPMIツールを使用して、消費電力を監視します。 PDUは、電力使用量に関するリアルタイムおよび履歴データを提供できます。これは、エネルギー効率と計画能力を管理するために重要です[4]。
- 詳細なエネルギー消費メトリック(パワーオン以来の総エネルギーなど)については、PrometheusやInfluxDBなどの外部ツールを使用して、時間の経過とともにデータを収集および分析する必要がある場合があります[4]。

8。DGXステーションA100との統合**

- DGXステーションA100がスマートPDUに適切に接続されており、すべての電源ケーブルが偶発的な切断を防ぐために安全にロックされていることを確認します[1]。
-NVIDIA DCGMや `nvidia-smi`などのツールを使用して、必要に応じてGPU固有の消費電力を監視します[4]。

これらの手順に従うことにより、DGXステーションA100で電力監視用のスマートPDUを効果的にセットアップし、効率的なエネルギー管理とシステムの信頼性を確保できます。

引用:
[1] http://cdn.cnetcontent.com/2f/68/2f6888a0-063f-4d76-94e4-86666b7619dfd.pdf
[2] https://www.robustthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://cdn10.servertech.com/assets/documents/documents/137/original/301-0125-4_smart_pdu_revv.pdf?1493072227
[4] https://www.reddit.com/r//hpc/comments/1125pw7/nvidia_dgxa100_energy_monitoring/
[5] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html
[6] https://www.ibm.com/docs/8335-gtg/p9hbf/p9hbf_configutility_isp.htm
[7] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/getting-started-station-a100.html
[8] https://www.youtube.com/watch?v=i6nx74lqtca