Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Apa perbedaan utama dalam kemampuan pemrosesan AI antara GB10 Superchip dan NVIDIA GB300


Apa perbedaan utama dalam kemampuan pemrosesan AI antara GB10 Superchip dan NVIDIA GB300


Superchip NVIDIA GB10 dan NVIDIA GB300 keduanya dirancang untuk meningkatkan kemampuan pemrosesan AI tetapi berbeda secara signifikan dalam arsitektur, kinerja, dan kasus penggunaan yang dimaksudkan.

GB10 Superchip

Superchip GB10 didasarkan pada arsitektur NVIDIA Grace Blackwell dan dioptimalkan untuk faktor bentuk desktop yang ringkas. Ini fitur GPU Blackwell yang kuat dengan inti tensor generasi kelima dan dukungan FP4, memberikan hingga 1.000 triliun operasi per detik (puncak) daya pemrosesan AI [1] [3]. GB10 mencakup CPU ARM 20-core, yang meningkatkan pemrosesan data dan orkestrasi data, penyetelan model percepatan dan inferensi waktu-nyata [1] [4]. Ini menawarkan 128GB memori koheren terpadu, memungkinkan pengembang untuk mengelola model AI hingga 200 miliar parameter [1] [7]. GB10 sangat ideal untuk para peneliti dan pengembang AI yang membutuhkan komputasi AI yang kuat di desktop mereka untuk membuat prototipe dan menyempurnakan model AI [6] [7].

NVIDIA GB300

Sebaliknya, NVIDIA GB300 dibangun dengan arsitektur Grace Blackwell Ultra dan dirancang untuk beban kerja AI yang lebih menuntut, terutama di lingkungan perusahaan. Ini fitur Blackwell Ultra GPU dengan inti tensor terbaru dan presisi FP4, terhubung ke NVIDIA Grace CPU berkinerja tinggi melalui NVLink-C2C [3] [5]. GB300 menawarkan peningkatan besar dalam kapasitas memori, dengan HBM3E hingga 288GB, yang mendukung model yang lebih besar secara langsung dalam memori dan mengurangi latensi untuk aplikasi waktu-nyata [2] [6]. Superchip ini adalah bagian dari stasiun DGX, yang menyediakan ruang memori koheren 784GB besar, membuatnya cocok untuk pelatihan skala besar dan menyimpulkan beban kerja [3] [6]. GB300 dioptimalkan untuk tugas pelatihan dan inferensi, dengan kemampuan jaringan yang ditingkatkan melalui kartu jaringan CX8 dan modul optik 1.6T, bandwidth penggandaan dibandingkan dengan pendahulunya [2].

Perbedaan utama

- Kinerja dan Arsitektur: GB10 memberikan hingga 1 petaflop kinerja AI, sedangkan GB300 menawarkan kekuatan komputasi yang jauh lebih tinggi, dengan fokus pada beban kerja AI skala yang lebih besar.
- Kapasitas memori: GB10 memiliki 128GB memori terpadu, sedangkan GB300 menawarkan hingga 288GB HBM3E, dan ketika diintegrasikan ke dalam sistem seperti stasiun DGX, ia dapat menyediakan hingga 784GB memori yang koheren.
- Penggunaan yang dimaksudkan: GB10 dirancang untuk pengembangan AI desktop, ideal untuk para peneliti dan pengembang yang membutuhkan penyebaran model AI langsung. GB300 ditargetkan di lingkungan perusahaan, mendukung kebutuhan infrastruktur AI skala besar.
- Jaringan dan skalabilitas: GB300 mencakup kemampuan jaringan canggih dengan kartu jaringan CX8, yang menggandakan bandwidth, membuatnya lebih cocok untuk pusat data hyperscale dan penyebaran AI skala besar. GB10 dapat menghubungkan dua sistem melalui ConnectX-7 NIC untuk menangani model yang lebih besar tetapi tidak dapat diukur seperti GB300 di lingkungan pusat data yang besar.

Kutipan:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-blackwell-superchip/
[2] https://drrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3.
[4] https://www.bigdatawire.com/this-just-int
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputer
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-bace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips