NVIDIA GB10 GRACE BLACKWELL SUPERCHIP je močan sistem na čipu (SOC), ki je zasnovan tako, da učinkovito ravna tako s treningom kot sklepanjem modelov AI. Je osrednji za sisteme, kot sta NVIDIA Project Digits in ASUS Ascent GX10 AI superračunalnik, katerih cilj je demokratizirati dostop do visokozmogljivega AI računalništva.
Ključne komponente in arhitektura
- GPU in tenzorska jedra: GB10 Superchip ima NVIDIA Blackwell GPU s tenzorskim jedrom pete generacije. Ta tenzorska jedra so optimizirana za množenje matriksa, ki so ključnega pomena za naloge globokega učenja. Znatno izboljšajo delovanje tako treninga kot procesov sklepanja z zagotavljanjem hitre obdelave zapletenih izračunov AI.
-CPU: Superchip vključuje visokozmogljiv CPU z 20 jedrnimi ARM, ki je sestavljen iz 10 CORTEX X925 CPU jeder in 10 A725 CPU jeder. Ta CPU izboljšuje predhodno obdelavo in orkestracijo podatkov, kar pospešuje uglaševanje modelov in sklepanje v realnem času. Arhitektura ARM prispeva k učinkovitemu upravljanju in uspešnosti moči, zaradi česar je primerna za Edge AI aplikacije.
- Pomnilnik in medsebojno povezovanje: GB10 Superchip ponuja 128 GB enotnega skladnega pomnilnika, kar je bistvenega pomena za ravnanje z velikimi modeli AI. Uporablja NVIDIA NVLINK-C2C, ki zagotavlja koheziven model pomnilnika CPU+GPU z bistveno večjo pasovno širino kot tradicionalni vmesniki PCIe. Ta arhitektura zagotavlja brezhibno prenos podatkov med CPU in GPU, optimizira tako naloge usposabljanja kot sklepanja.
Zmogljivosti za usposabljanje in sklepanje
- Trening: Medtem ko GB10 Superchip ni zasnovan predvsem kot namenski trening čip, kot je Nvidia's Tesla GPU, lahko obravnava prototipiranje in natančno nastavitev modelov AI. Njegova visokozmogljiva kombinacija GPU in CPU omogoča razvijalcem, da delujejo na manjših do srednje velikih modelih neposredno na svojih namiznih računalnikih. Za večje modele se lahko uporablja v povezavi s storitvami v oblaku za obsežnejše naloge za usposabljanje.
-Sklepanje: GB10 Superchip se odlikuje pri nalogah sklepanja, pri čemer učinkovito izvaja predhodno usposobljene modele za sprejemanje odločitev v realnem času na podlagi novih podatkov. Njegova podpora za jedra FP4 natančnosti in tenzorja pete generacije omogoča hitro in natančno obdelavo modelov AI, zaradi česar je idealna za aplikacije, ki zahtevajo hitro sklepanje, kot so Edge AI, robotika in pametne naprave IoT.
Scalibility in uvajanje
Tako projektne številke kot ASUS Ascent GX10 omogočata brezhibno namestitev modelov AI iz lokalnih namiznih okolij v infrastrukturo v oblaku ali podatkovnem centru z uporabo programske opreme NVIDIA AI. To pomeni, da lahko razvijalci prototipirajo modele lokalno in jih nato povečajo v oblaku brez pomembnih prilagoditev kode, kar olajša učinkovite postopke ponovitve in uvajanja.
Če povzamemo, je GB10 Superchip zasnovan tako, da opolnomoči razvijalce AI s kompaktnim, a močnim orodjem za naloge usposabljanja in sklepanja. Čeprav je bolj usmerjen k sklepanju in prototipiranju, se lahko njegove zmogljivosti razširijo z integracijo s storitvami v oblaku za obsežnejše potrebe po usposabljanju.
Navedbe:
[1] https://www.hyperStack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-znan-about-the-blackwell-ai-supercomputer
[2] https://www.nvidia.com/en-us/project-digits/
[3] https://www.marketscreener.com/quote/stock/ASUSTEK-COMPUTER-INC-6492304/news/ASUS-Introduces-Ascent-GX10-AI-Supercomputer-Powered-by-NVIDIA-GB10-Grace-Blackwell-Superchip-49372339/
[4] https://press.asus.com/news/press-releases/asus-introduces-gx-gx-10-ai-Supercomputer-powered-by-nvidia-gb-10-Grace-blackwell-superchip
[5] https://www.mediatek.com/press-room/mediatek-collaborates-with-nvidia-on-the-new-nvidia-gb10-grace-blackwell-superchip-powering-the-nvidia-project-digits-personal-ai-supercomputer
[6] https://www.friendsofthemetaverse.com/blog/ai-chips-explained-training-vs-inference-processors-Unveiled
[7] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips
[8] https://www.reddit.com/r/deeplearning/comments/1hywfah/nvidia_project_digits_vs_rtx_5090_dilemma/
[9] https://meta-quantum.today/?p=3460
[10] https://newsroom.arm.com/blog/arm-nvidia-project-digits-high-Performance-ai