Nvidia GB10 Superchip vs GB300: AI jõudlus ja arhitektuuri võrdlus

Millised on AI töötlemise võimaluste peamised erinevused GB10 SuperChip ja NVIDIA GB300 vahel

NVIDIA GB10 SuperChip ja NVIDIA GB300 on mõlemad mõeldud AI töötlemisvõimaluste parandamiseks, kuid erinevad märkimisväärselt nende arhitektuuri, jõudluse ja kavandatud kasutusjuhtumite osas.

GB10 Superchip

GB10 SuperChip põhineb Nvidia Grace Blackwelli arhitektuuril ja on optimeeritud kompaktsete töölauavormide tegurite jaoks. Sellel on kindel Blackwelli GPU, millel on viienda põlvkonna tensor-südamikud ja FP4 tugi, mis annab AI töötlemisvõimsuse (1] [3] kuni 1000 triljonit toimingut sekundis (tipud). GB10 sisaldab 20-tuumalist ARM CPU-d, mis suurendab andmete eeltöötlemist ja orkestratsiooni, kiirendades mudeli häälestamist ja reaalajas järeldamist [1] [4]. See pakub 128 GB ühtset sidusat mälu, mis võimaldab arendajatel hallata AI -mudeleid kuni 200 miljardit parameetrit [1] [7]. GB10 sobib ideaalselt AI teadlastele ja arendajatele, kes vajavad oma lauaarvutites võimsaid AI-andmeid prototüüpimiseks ja peenhäälestamiseks AI-mudelite jaoks [6] [7].

NVIDIA GB300

Seevastu NVIDIA GB300 on ehitatud koos Grace Blackwelli Ultra arhitektuuriga ja on mõeldud nõudlikumaks AI töökoormuseks, eriti ettevõtluskeskkonnas. Sellel on Blackwelli ultra GPU koos uusimate tensor-südamike ja FP4 täpsusega, mis on ühendatud NVLink-C2C kaudu suure jõudlusega Nvidia Grace CPU-ga [3] [5]. GB300 pakub mälumahu märkimisväärset suurenemist kuni 288 GB HBM3E, mis toetab suuremaid mudeleid otse mälus ja vähendab reaalajas rakenduste latentsusaega [2] [6]. See superchip on osa DGX-jaamast, mis pakub massiivset 784 GB sidusat mäluruumi, muutes selle sobivaks suuremahuliseks treenimiseks ja töökoormuseks [3] [6]. GB300 on optimeeritud nii treeningu- kui ka järelduste ülesannete jaoks, milles on CX8 võrgukaardi ja 1,6T optiliste moodulite kaudu suurenenud võrguvõimalused, kahekordistades ribalaiust võrreldes eelkäijaga [2].

Peamised erinevused

- jõudlus ja arhitektuur: GB10 pakub AI jõudlust kuni 1 petaflop, samas kui GB300 pakub märkimisväärselt suuremat arvutuslikku energiat, keskendudes suuremahulistele AI töökoormustele.
- Mälumaht: GB10 -l on 128 GB ühtset mälu, samas kui GB300 pakub kuni 288 GB HBM3E ja kui see integreeritakse sellistesse süsteemidesse nagu DGX -jaam, võib see pakkuda kuni 784 GB sidusat mälu.
- Kavandatud kasutamine: GB10 on mõeldud töölaua AI arendamiseks, mis sobib ideaalselt teadlastele ja arendajatele, kes vajavad viivitamatut AI -mudeli juurutamist. GB300 on suunatud ettevõtluskeskkondadele, toetades suuremahulisi AI infrastruktuuri vajadusi.
- Võrgustik ja mastaapsus: GB300 sisaldab täiustatud võrgustiku võimalusi CX8 võrgukaardiga, mis kahekordistab ribalaiust, muutes selle sobivamaks hüperskaala andmekeskuste ja suuremahuliste AI juurutamiseks. GB10 saab ühendada kahte süsteemi Connectx-7 NIC-de kaudu suuremate mudelite käsitsemiseks, kuid see pole nii skaleeritav kui GB300 suurtes andmekeskuste keskkondades.

Tsitaadid:
]
]
[3] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-Station-Personal-Ai-Computers
]
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
]
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
]