„NVIDIA GB10 Superchip“ ir „NVIDIA GB300“ yra skirti pagerinti AI apdorojimo galimybes, tačiau jų architektūros, našumo ir numatytų naudojimo atvejais labai skiriasi.
GB10 Superchip
„GB10 Superchip“ yra pagrįstas „Nvidia Grace Blackwell“ architektūra ir yra optimizuota kompaktiškam, stalinio formos veiksniams. Jame yra tvirtas „Blackwell“ GPU su penktosios kartos tenzoriniais šerdimis ir FP4 atrama, vykdanti iki 1000 trilijonų operacijų per sekundę (viršūnės) AI perdirbimo galią [1] [3]. „GB10“ apima 20 branduolių ARM procesorių, kuris padidina duomenų išankstinį apdorojimą ir orkestravimą, pagreitinantį modelio derinimą ir realiojo laiko išvadą [1] [4]. Jis siūlo 128 GB vieningos nuoseklios atminties, leidžiančią kūrėjams valdyti AI modelius iki 200 milijardų parametrų [1] [7]. „GB10“ yra idealus AI tyrėjams ir kūrėjams, kuriems reikalinga galinga AI kompiuterija ant savo stalinių kompiuterių prototipų kūrimui ir tiksliniam AI modeliams [6] [7].
NVIDIA GB300
Priešingai, „NVIDIA GB300“ yra pastatytas su „Grace Blackwell Ultra Architecture“ ir yra skirta reiklesniams AI darbo krūviams, ypač įmonių aplinkoje. Jame yra „Blackwell Ultra GPU“ su naujausiais „Tensor“ šerdimis ir FP4 tikslumu, sujungtu su aukštos kokybės „Nvidia Grace“ CPU per „NVLINK-C2C“ [3] [5]. „GB300“ žymiai padidina atminties talpą-iki 288 GB HBM3E, kuris palaiko didesnius modelius tiesiogiai atmintyje ir sumažina delsą realiojo laiko programoms [2] [6]. Šis „Superchip“ yra DGX stoties dalis, kuri suteikia didžiulę 784 GB nuoseklios atminties erdvės, todėl ji yra tinkama didelio masto treniruotėms ir darymo krūviams [3] [6]. „GB300“ yra optimizuotas tiek mokymo, tiek išvadų užduotims, kurių patobulintos tinklo galimybės per „CX8“ tinklo kortelę ir 1,6T optinius modulius, dvigubai padidinant pralaidumą, palyginti su jo pirmtaku [2].
Pagrindiniai skirtumai
- Našumas ir architektūra: „GB10“ tiekia iki 1 PETAFLOP AI našumo, o „GB300“ siūlo žymiai didesnę skaičiavimo galią, daugiausia dėmesio skiriant didesnio masto AI darbo krūviams.
- Atminties talpa: GB10 turi 128 GB vieningos atminties, tuo tarpu „GB300“ siūlo iki 288 GB HBM3E, o integruotas į tokias sistemas kaip DGX stotis, ji gali suteikti iki 784 GB nuoseklios atminties.
- Numatytas naudojimas: „GB10“ yra skirtas darbalaukio AI kūrimui, idealiai tinka tyrėjams ir kūrėjams, kuriems reikia nedelsiant diegti AI modelį. „GB300“ yra skirtas įmonių aplinkai, palaikant didelio masto AI infrastruktūros poreikius.
- Tinklo kūrimas ir mastelio keitimas: „GB300“ apima pažangias tinklo galimybes su „CX8“ tinklo kortele, kuri padidina pralaidumą, todėl jis yra tinkamesnis hiperscale duomenų centruose ir didelio masto AI diegimui. „GB10“ gali sujungti dvi sistemas per „Connectx-7“ NIC, kad būtų galima tvarkyti didesnius modelius, tačiau nėra tokia keičiama kaip „GB300“ didelėje duomenų centro aplinkoje.
Citatos:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputers-powered-by-nvidia-gb-10-grace blackwell-sperchip/
[2] https://drrrrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-park-and-dgx-stiation-personal-ai-computers
[4] https://www.bigdatawire.com/this-just-in/nvidia-unveils-project-digits-personal-ai-supercomputer/
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-superkompiuteriai
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-at-every-ai-developers-fingterps