DGX istasyonundaki NVLink-C2C'nin enerji verimliliği, güç tüketimini ve ısı üretimini azaltarak termal yönetimini etkiler. NVLink-C2C, işlemciler ve hızlandırıcılar arasında tutarlı ve güvenli bir bağlantı sağlayan ve PCIE gibi geleneksel ara bağlantılara kıyasla önemli ölçüde daha yüksek enerji verimliliği sunan yüksek hızlı bir ara bağlantı teknolojisidir. Bu verimlilik, AI iş yükleri talep etmek için tasarlanmış DGX istasyonu gibi sistemler için çok önemlidir.
NVLink-C2C Enerji Verimliliği
NVLink-C2C, bileşenler arasında veri aktarımı için gereken gücü en aza indirerek enerji verimliliğini artırır. Bunu, diğer işlemciler veya IP blokları ile tamamen tutarlı ve güvenli hızlandırıcıları destekleme yeteneği ile elde eder, bu da gelişmiş ambalajlı NVIDIA yongaları üzerinde PCIE Gen 5 phy'ye kıyasla 25 kat daha yüksek enerji verimliliğine neden olur [4]. Güç tüketimindeki bu azalma, çalışma sırasında üretilen toplam ısıyı düşürerek DGX istasyonunun termal yönetimini doğrudan etkiler.
Termal yönetim üzerindeki etki
1. Azaltılmış ısı üretimi: Daha düşük güç tüketimi, sistem tarafından daha az ısı üretildiği anlamına gelir. Bu, yoğun hesaplama iş yükleri nedeniyle aşırı ısınmaya eğilimli olan DGX istasyonu gibi yüksek performanslı bilgi işlem sistemleri için özellikle önemlidir.
2. Soğutma Sistemi Verimliliği: DGX istasyonu, GPU'ların termal tasarım gücünün (TDP) önemli bir bölümünü yakalamak için tasarlanmış bir su soğutma sistemine sahiptir ve verimli ısı dağılımı ve sessiz çalışma sağlar [3]. NVLink-C2C'nin enerji verimliliği nedeniyle azaltılmış ısı yükü, optimal termal aralıklar içinde çalışmasını sağlayarak aşırı soğutma talepleri olmadan performansı koruyarak bu soğutma sistemini tamamlar.
3. Sistem tasarımı ve ölçeklenebilirliği: NVLink-C2C tarafından kolaylaştırılan enerji tasarruflu tasarım, daha fazla ölçeklenebilir sistem yapılandırmasına izin verir. Bu, birden fazla DGX istasyonunun hem veri aktarımı hem de termal yönetimi açısından verimli bir şekilde bağlanabileceği ve bunaltıcı soğutma sistemleri olmadan daha büyük ölçekli AI hesaplama dağıtımlarını sağlayabileceği anlamına gelir.
Özetle, DGX istasyonunda NVLink-C2C'nin enerji verimliliği, güç tüketimini ve ısı üretimini azaltarak iyileştirilmiş termal yönetime katkıda bulunur ve bu da sistemin genel soğutma verimliliğini ve ölçeklenebilirliğini arttırır. NVLink-C2C ve DGX istasyonunun soğutma sistemi arasındaki bu sinerji, AI iş yükleri talep etmek için güvenilir ve yüksek performanslı işlem sağlar.
Alıntılar:
[1] https://www.techpowerup.com/334300/nvidia-onnounces-dgx-spark-dgx-tation-personal-a-cicomputers
[2] https://training.continuumlabs.ai/infrastructure/servers-and chips/nvidia-gb200-nvl72
[3] https://images.nvidia.com/content/newsletters/email/pdf/dgx-station-wp.pdf
[4] https://www.linkedin.com/pulse/nvidia-nvlink-scality-from-die-die-supercomputers-mohamed-hakam-hefny
[5] https://www.nvidia.com/en-us/data-center/dgx-platform/
[6] https://www.supercluster.blog/p/6-ai-supercluster-nvidia-dgx-h100
[7] https://nvidianews.nvidia.com/news/nvidia-ansunces-dgx-spark-dgx
[8] https://www.nvidia.com/en-gb/data-center/dgx-station/
[9] https://en.wikipedia.org/wiki/nvlink