IPMI (Intelligent Platform Management Interface) 인터페이스는 NVIDIA DGX 스테이션 A100 시스템을 모니터링하고 관리하는 데 중요한 역할을합니다. IPMI는 서버 관리에 사용되는 일련의 사양으로 관리자가 시스템에 물리적으로 액세스 할 필요없이 하드웨어 장치를 원격으로 모니터링하고 제어 할 수 있습니다. 이는 데이터 과학 팀을위한 강력한 AI 작업 그룹 서버로 설계된 DGX 스테이션 A100의 건강 및 성능을 유지하는 데 특히 유용합니다.
DGX 스테이션 A100에서 IPMI의 주요 기능
1. 원격 모니터링 : IPMI를 사용하면 전원 공급 장치, 팬 속도 및 서버 건강과 같은 중요한 시스템 매개 변수를 원격 모니터링 할 수 있습니다. 이를 통해 관리자는 시스템이 물리적으로 존재하지 않으면 서 시스템이 최적으로 기능하고 있는지 확인할 수 있습니다 [3] [4].
2. LAN (SOL) 인터페이스 오버 시리얼 : IPMI 인터페이스에는 SOL (Serial over LAN) 기능이 포함되어있어 시스템의 직렬 콘솔에 액세스 할 수 있습니다. 이를 통해 관리자는 BIOS 설정을 관리하거나 설치된 운영 체제와 원격으로 상호 작용할 수 있으며 이는 문제 해결 및 구성 작업에 필수적입니다 [1] [4].
3. 시스템 로그 및 센서 : IPMI는 센서 데이터 및 시스템 이벤트 로그를 수집하고 저장할 수 있습니다. 이 정보는 문제를 진단하고 시스템이 온도 및 전압 수준과 같은 안전한 매개 변수 내에서 작동하는 데 중요합니다 [3] [4].
4. 보안 : IPMI는 인증 기능을 지원하여 승인 된 사용자 만 시스템에 액세스하고 관리 할 수 있도록합니다. 이것은 민감한 데이터의 보안을 유지하고 무단 액세스를 방지하는 데 필수적입니다 [3] [7].
5. 대역 외 관리 : IPMI는 시스템 운영 체제와 독립적으로 작동하므로 관리자가 전원이 꺼져 있거나 제대로 작동하지 않더라도 관리자가 시스템을 관리 할 수 있습니다. 이 대역 외 관리 기능은 시스템 가용성을 유지하고 다운 타임을 줄이는 데 필수적입니다 [3] [4].
구성 및 보안 고려 사항
DGX 스테이션 A100에서 IPMI를 구성하려면 'IPMITOOL'과 같은 도구를 사용하여 IPMI를 구현하는 하드웨어 구성 요소 인 BMC (Baseboard Management Controller)의 정적 IP 주소를 설정할 수 있습니다. 여기에는 IP 주소 소스를 정적으로 설정하고 IP 주소, 서브넷 마스크 및 기본 게이트웨이를 구성하는 것이 포함됩니다 [4].
보안의 경우 NVIDIA는 IPMI 포트를 전용 관리 네트워크로 분리하거나 전용 네트워크를 사용할 수없는 경우 BMC 트래픽에 대해 별도의 VLAN을 구성하는 것이 좋습니다. 이는 시스템을 무단 액세스로부터 보호하고 관리 트래픽이 정기적 인 네트워크 트래픽으로부터 분리되도록합니다 [7].
요약하면 DGX 스테이션 A100의 IPMI 인터페이스는 관리자가 어디서나 시스템을 모니터링하고 제어 할 수 있도록 포괄적 인 원격 관리 기능을 제공하여 시스템 안정성, 보안 및 성능을 향상시킵니다.
인용 :
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architection--paper_published.pdf
[2] https://www.pny.com/en-eu/file%20library/professional/datasheet/dgx/dgx_station_a100_datasheet_pny-web.pdf
[3] https://bleuwire.com/everything-you-need-to-know-about-ipmi/
[4] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/using-bmc.html
[5] https://docs.nvidia.com/dgx/pdf/dgx-station-a100-user-guide.pdf
[6] https://quizlet.com/435704401/nvidia-introduction-to-ai-in-the-dc-flash-cards/
[7] http://cdn.cnetcontent.com/2f/68/2f688a0-063f-4d76-94e4-8666b7619dfd.pdf
[8] https://docs.nvidia.com/dgx/dgx-station-a100-user-guide/index.html