NVIDIA DGX istasyonu A100, uzaktan yönetim için güçlü izleme özellikleri sunar, AI ve yüksek performanslı bilgi işlem ortamlarında kullanılabilirliğini ve verimliliğini artırır. İşte bazı temel özellikler:
1. Süpürgelik yönetim denetleyicisi (BMC): DGX istasyonu A100, uzaktan erişim ve kontrol için web tabanlı bir arayüz sağlayan gömülü bir BMC içerir. Bu arabirim, kullanıcıların GPU'lar, bellek DIMM'leri, CPU, ekran kartı ve anakart için sıcaklık sensörleri dahil olmak üzere çeşitli sistem bileşenlerini izlemelerini sağlar. Ek olarak, hem geçmiş grafikleri hem de güncel okumaları göstererek fan hızlarını, güç tüketimini ve sistem voltajlarını izler [1] [4].
2. IPMI Arayüzü: BMC ayrıca IPMI'yi (Akıllı Platform Yönetimi Arayüzü) destekler ve izleme yazılımının kullanıcı müdahalesi olmadan günlükleri, istatistikleri ve sensör okumalarını otomatik olarak toplamasını sağlar. IPMI, BIOS ayarlarını veya yüklü işletim sistemini yönetmek için sistemin seri konsoluna erişim sağlayan bir seri (SOL) arayüzü içerir [1].
3. Uzak KVM yeteneği: Web tabanlı arayüz uzak klavye, video, fare (KVM) işlevi sunar. Bu, kullanıcıların sistemin ekranını görüntülemelerini ve uzaktan yönetmelerini sağlar. KVM özelliği ayrıca, kullanıcıların uzaktan birimleri monte etmesini ve sistemi yeniden yükleme veya bir ISO görüntüsünden önyükleme gibi görevleri gerçekleştirmesini sağlayan sanal depolama alanı da destekler [1].
4. Ağ Konsolidasyonu: DGX istasyonu A100, ağ denetleyicisi yan bandı arabirimini (NCSI) kullanarak ağ bağlantılarını birleştirebilir, bu da hem uzaktan yönetim hem de normal sistem LAN bağlantılarının tek bir ağ düşüşüyle yönetilmesine izin verir. Bu, kurulumu basitleştirir ve gerekli bağlantı noktası sayısını azaltır [1].
5. DGX İstasyon Yöneticisi: Sadece A100 modeline özgü olmasa da, NVIDIA, birden fazla DGX sisteminde kaynakları yönetmek için DGX İstasyon Yöneticisi gibi araçlar sunar. Bu araç, kullanıcıların kaynak kullanımını izlemelerine, işleri planlamasına ve kullanıcı izinlerini merkezi bir arayüzden yönetmesine olanak tanır [10].
Genel olarak, DGX istasyonu A100, kapsamlı uzaktan izleme ve yönetim özellikleri sağlar ve hem yerel hem de uzak AI bilgi işlem ortamları için uygun hale getirir.
Alıntılar:
[1] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-paper_published.pdf
[2] https://nvidianews.nvidia.com/news/nvidia-ansunces-dgx-spark-dgx
[3] https://docs.nvidia.com/dgx/pdf/dgx-tation-user-guide.pdf
[4] https://docs.nvidia.com/dgx/dgx
[5] https://www.nvidia.com/en-us/products/workstations/dgx-station/
[6] https://docs.nvidia.com/dgx/pdf/dgx
[7] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-ptation-a100-
[8] https://www.pcmag.com/news/what-is-nvidias-dgx-tation-a-newsescialize-desktop-for-ai-work
[9] https://www.com.com/dgxstation-a100.html
[10] https://www.serversimply.com/blog/how-to-connect-to-nvidia-dgx-cloud-Advantages-configurations-and-setup-guide