Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kādas ir galvenās atšķirības AI apstrādes iespējās starp GB10 Superchip un NVIDIA GB300


Kādas ir galvenās atšķirības AI apstrādes iespējās starp GB10 Superchip un NVIDIA GB300


Gan NVIDIA GB10 Superchip, gan NVIDIA GB300 ir izstrādāti, lai uzlabotu AI apstrādes iespējas, bet ievērojami atšķiras ar to arhitektūru, veiktspēju un paredzētajiem lietošanas gadījumiem.

GB10 Superchip

GB10 SuperChip balstās uz NVIDIA Grace Blackwell arhitektūru un ir optimizēts kompaktiem, darbvirsmas formas faktoriem. Tam ir izturīgs Blackwell GPU ar piektās paaudzes tensora serdeņiem un FP4 atbalstu, nodrošinot līdz 1000 triljoniem operāciju sekundē (top) AI apstrādes jaudas [1] [3]. GB10 ietver 20 kodolu ARM CPU, kas uzlabo datu priekšapstrādi un orķestrēšanu, paātrinot modeļa noregulēšanu un reālā laika secinājumus [1] [4]. Tas piedāvā 128 GB vienotas koherentas atmiņas, ļaujot izstrādātājiem pārvaldīt AI modeļus līdz 200 miljardiem parametru [1] [7]. GB10 ir ideāli piemērots AI pētniekiem un izstrādātājiem, kuriem nepieciešama jaudīga AI skaitļošana uz galddatoriem, lai prototipētu un precizētu AI modeļus [6] [7].

NVIDIA GB300

Turpretī NVIDIA GB300 ir veidots ar Grace Blackwell Ultra arhitektūru un ir paredzēts prasīgākas AI darba slodzes, jo īpaši uzņēmuma vidē. Tam ir Blackwell Ultra GPU ar jaunākajiem tensora kodoliem un FP4 precizitāti, kas savienota ar augstas veiktspējas NVIDIA GRACE CPU, izmantojot NVLink-C2C [3] [5]. GB300 piedāvā ievērojamu atmiņas ietilpības palielināšanos ar HBM3E līdz 288 GB, kas atbalsta lielākus modeļus tieši atmiņā un samazina reālā laika lietojumprogrammu latentumu [2] [6]. Šī superchip ir daļa no DGX stacijas, kas nodrošina masīvu 784 GB koherentas atmiņas telpas, padarot to piemērotu liela mēroga apmācībai un secināšanas darba slodzēm [3] [6]. GB300 ir optimizēts gan apmācības, gan secinājumu uzdevumiem ar uzlabotām tīkla iespējām caur CX8 tīkla karti un 1,6T optiskajiem moduļiem, divkāršojot joslas platumu, salīdzinot ar tā priekšgājēju [2].

Galvenās atšķirības

- Veiktspēja un arhitektūra: GB10 nodrošina līdz 1 Petaflop AI veiktspēju, savukārt GB300 piedāvā ievērojami lielāku skaitļošanas jaudu, koncentrējoties uz lielāka mēroga AI darba slodzēm.
- Atmiņas ietilpība: GB10 ir 128 GB vienotas atmiņas, turpretī GB300 piedāvā līdz 288 GB HBM3E, un, integrējot tādās sistēmās kā DGX stacija, tā var nodrošināt līdz 784 GB saskaņotas atmiņas.
- Paredzētā lietošana: GB10 ir paredzēts darbvirsmas AI izstrādei, kas ir ideāli piemērota pētniekiem un izstrādātājiem, kuriem nepieciešama tūlītēja AI modeļa izvietošana. GB300 ir paredzēts uzņēmuma vidē, kas atbalsta liela mēroga AI infrastruktūras vajadzības.
- Tīklošana un mērogojamība: GB300 ietver uzlabotas tīkla iespējas ar CX8 tīkla karti, kas dubultojas joslas platumā, padarot to piemērotāku hiperskalas datu centriem un liela mēroga AI izvietošanai. GB10 var savienot divas sistēmas, izmantojot ConnectX-7 NIC, lai apstrādātu lielākus modeļus, bet nav tik mērogojams kā GB300 lielā datu centra vidē.

Atsauces:
[1] https://press.asus.com/news/press-releases/
[2] https://drrrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3.]
.
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6.]
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-e-ery-ai-Developer-Fingertipips