NVIDIA GB10 Superchip ve NVIDIA GB300, AI işleme yeteneklerini arttırmak için tasarlanmıştır, ancak mimarileri, performansları ve amaçlanan kullanım durumlarında önemli ölçüde farklılık gösterir.
GB10 Superchip
GB10 Superchip, Nvidia Grace Blackwell mimarisine dayanmaktadır ve kompakt, masaüstü form faktörleri için optimize edilmiştir. Beşinci nesil tensör çekirdekleri ve FP4 desteğine sahip sağlam bir Blackwell GPU'ya sahiptir ve saniyede 1.000 trilyon operasyon (üstler) yapay zeka işleme gücü [1] [3]. GB10, veri önceden işleme ve düzenlemeyi arttıran, model ayarını hızlandıran ve gerçek zamanlı çıkarım [1] [4] 20 çekirdekli bir CPU içerir. 128GB birleşik tutarlı bellek sunar ve geliştiricilerin AI modellerini 200 milyar parametreye kadar yönetmelerine izin verir [1] [7]. GB10, prototipleme ve ince ayar AI modelleri için masaüstlerinde güçlü AI hesaplamasına ihtiyaç duyan AI araştırmacıları ve geliştiricileri için idealdir [6] [7].
NVIDIA GB300
Buna karşılık, NVIDIA GB300 Grace Blackwell Ultra Mimarisi ile inşa edilmiştir ve özellikle kurumsal ortamlarda daha zorlu AI iş yükleri için tasarlanmıştır. NVLink-C2C üzerinden yüksek performanslı bir NVIDIA Grace CPU'ya bağlı en son tensör çekirdekleri ve FP4 hassasiyetine sahip bir Blackwell Ultra GPU'ya sahiptir [3] [5]. GB300, daha büyük modelleri doğrudan bellekte destekleyen ve gerçek zamanlı uygulamalar için gecikmeyi azaltan 288GB HBM3E ile bellek kapasitesinde önemli bir artış sunar [2] [6]. Bu süperchip, büyük bir 784GB tutarlı bellek alanı sağlayan DGX istasyonunun bir parçasıdır, bu da onu büyük ölçekli eğitim ve çıkarma iş yükleri için uygun hale getirir [3] [6]. GB300, selefine kıyasla bant genişliğini iki katına çıkararak, CX8 ağ kartı ve 1.6T optik modüller aracılığıyla geliştirilmiş ağ özelliklerine sahip hem eğitim hem de çıkarım görevleri için optimize edilmiştir [2].
Anahtar Farklılıklar
- Performans ve Mimari: GB10, 1 Petaflop AI performansı sunarken, GB300 daha büyük ölçekli AI iş yüklerine odaklanarak önemli ölçüde daha yüksek hesaplama gücü sunar.
- Bellek kapasitesi: GB10 128GB birleşik belleğe sahipken, GB300 288GB'a kadar HBM3E sunar ve DGX istasyonu gibi sistemlere entegre edildiğinde 784GB'a kadar tutarlı bellek sağlayabilir.
- Amaçlanan Kullanım: GB10, anında AI model dağıtımına ihtiyaç duyan araştırmacılar ve geliştiriciler için ideal olan masaüstü AI geliştirme için tasarlanmıştır. GB300, büyük ölçekli AI altyapı ihtiyaçlarını destekleyen kurumsal ortamlara yöneliktir.
- Ağ oluşturma ve ölçeklenebilirlik: GB300, bant genişliğini iki katına çıkaran, hiper ölçekli veri merkezleri ve büyük ölçekli AI dağıtımları için daha uygun hale getiren CX8 Ağ Kartı ile gelişmiş ağ özellikleri içerir. GB10, daha büyük modelleri işlemek için Connectx-7 NIC'ler üzerinden iki sistemi bağlayabilir, ancak büyük veri merkezi ortamlarında GB300 kadar ölçeklenebilir değildir.
Alıntılar:
[1] https://press.asus.com/news/press-reelees/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-grace-blackwell-sperchip/
[2] https://drrobertcastellano.substack.com/p/nvidia-gb300-redefencing-aicomputing
[3] https://nvidianews.nvidia.com/news/nvidia-ansunces-dgx-spark-dgx
[4] https://www.bigdatawire.com/this-just-in/nvidia-unveils-project-digiits-i-a-supercomputer/
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-vover-desk-and-t-avery-a-e-velopers-fingerpupts