Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kaip „Blackwell GPU“ padidina AI našumą DGX kibirkštyje


Kaip „Blackwell GPU“ padidina AI našumą DGX kibirkštyje


„NVIDIA Blackwell GPU“ žymiai padidina AI našumą DGX kibirkštyje, pasinaudodama keliais pagrindiniais architektūriniais pasiekimais ir technologijomis. Čia pateikiama išsami apžvalga, kaip „Blackwell“ prisideda prie geresnių AI galimybių DGX kibirkštyje:

Architektūra ir dizainas **

1. „Dual-Die“ dizainas: „Blackwell GPU“ pasižymi dviem tinklainės ribotais štampais, sujungtais 10 TB/s lusto-chip jungties jungtimi, veiksmingai padvigubindami apdorojimo galią viename GPU. Šis dizainas sustiprina lygiagrečių apdorojimo galimybes, labai svarbias sudėtingoms AI užduotims [2] [3].

2. TSMC 4NP procesas: pagamintas naudojant TSMC pažangų 4NP procesą, „Blackwell GPU“ sudaro 208 milijardų tranzistoriai. Šis didelis tranzistoriaus tankis leidžia padidinti skaičiavimo galią ir efektyvumą [2] [3].

našumo patobulinimai **

1. Tensoro šerdys ir transformatoriaus variklis: „Blackwell GPU“ maitina antros kartos transformatoriaus varikliu ir pasirinktine „Tensor Core“ technologija. Šie pasiekimai pagreitina mokymą ir išvadą didelių kalbų modeliams (LLMS) ir ekspertų mišinių modeliams, suteikdami reikšmingą AI programų našumo padidėjimą [2] [8].

2. Penktosios kartos „NVLink“: naujausia „NVLink“ technologija siūlo dvikryptį 1,8 TB/s GPU pralaidumą, palengvindamas didelės spartos ryšį tarp kelių GPU. Tai ypač naudinga sudėtiniams AI modeliams, kuriems reikalingas masinis lygiagretus apdorojimas [2] [3].

3. FP4 ir mikroskopavimo palaikymas: „Blackwell GPUS“ palaiko naujus tikslus, tokius kaip FP4 ir mikroskopavimo formatai, kurie padidina AI skaičiavimų tikslumą ir efektyvumą, ypač atliekant generuojančias AI užduotis [8].

DGX Spark Integration **

„DGX Spark“, maitinamas „NVIDIA GB10 Grace Blackwell Superchip“, suteikia „Blackwell“ galimybes į darbalaukio formos faktorių. Ši integracija leidžia tyrėjams ir kūrėjams paleisti ir patobulinti didelius AI modelius vietoje arba diegti juos debesų infrastruktūroje su minimaliais pakeitimais [7].

1. CPU+GPU nuoseklumas: „GB10 Superchip“ naudoja NVLINK-C2C „Interconnect“ technologiją, kad pateiktų CPU+GPU-coherent atminties modelį. Tai žymiai sustiprina daug atminties reikalaujančių AI darbo krūvių, nes leidžia greičiau pasiekti duomenis tarp CPU ir GPU [7].

2. AI apdorojimo galimybės: „GB10 Superchip“ palaiko iki 1 000 AI apdorojimo viršūnių, leidžiančių efektyviai suderinti AI modelius ir išvadą, įskaitant pamatų modelius, tokius kaip „Nvidia CosMOS Priežastis“ ir „GR00T N1“ [7].

Saugumas ir efektyvumas **

1. Pažangios konfidencialios skaičiavimo: „Blackwell GPU“ yra optimizuoti naudojant pažangias konfidencialias skaičiavimo galimybes, užtikrinant, kad AI modeliai ir klientų duomenys būtų apsaugoti nepakenkiant našumui. Tai labai svarbu privatumui jautrioms pramonės šakoms [2] [3].

2. Energijos efektyvumas: Nepaisant aukšto našumo, „Blackwell“ GPU yra skirtas sumažinti energijos suvartojimą per operaciją, prisidedant prie tvaresnio AI apdorojimo duomenų centruose ir darbalaukio aplinkoje [2].

Apibendrinant galima pasakyti, kad „NVIDIA Blackwell GPU“ padidina AI našumą DGX kibirkštyje, siūlydama neprilygstamą apdorojimo galią, pažangias tensorinės pagrindinės technologijos, greitaeigių jungčių ir pagerinęs efektyvumą. Šios savybės daro „DGX“ kibirkštį idealia platforma, skirta kurti ir tobulinti sudėtingus AI modelius darbalaukyje.

Citatos:
[1] https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-aifactory-platform-paves-way-for- o-e-e-measoning
[2] https://www.trgdatacenters.com/resource/nvidia-blackwell/
[3] https://www.hysperstack.cloud/blog/thought-leadership/everything-you-reed-to-known-outhe-nvidia-blackwell-gpus
[4] https://www.amax.com/comparling-nvidia-blackwell-configurations/
[5] https://developer.nvidia.com/blog/nvidia-blackwell-delivers-world-record-deepseek-r1-inference-stransance/
[6] https://datacrunch.io/blog/nvidia-blackwell-b100-b200-gpu
[7] https://www.engineering.com/nvidia-unveils-dgx-personal-ai-supercomputers-by-grace-blackwell/
[8] https://www.nvidia.com/en-us/data-center/technologies/blackwell-architcture/
[9] https://www.nvidia.com/en-us/products/workstations/dgx-spark/