Nvidia GB10 Grace Blackwell Superchip je výkonný systém na čipu (SOC) navržený tak, aby efektivně zvládl jak trénink, tak inference modelů AI. Cílem je demokratizovat přístup k vysoce výkonnému výpočtu AI, který je ústřední pro systémy, jako jsou číslice projektů NVIDIA a superpočítač Asus Ascent GX10.
Klíčové komponenty a architektura
- Jádra GPU a Tensor: Superchip GB10 je vybaven GPU NVIDIA Blackwell GPU s tenzorovými jádry páté generace. Tato tenzorová jádra jsou optimalizována pro maticové multiplikace, které jsou zásadní pro hluboké úkoly učení. Významně zvyšují výkon tréninkových i inferenčních procesů poskytováním vysokorychlostního zpracování komplexních výpočtů AI.
-CPU: Superchip zahrnuje vysoce výkonný procesor s 20jádrovými rameny, který se skládá z 10 jádra CPU Cortex X925 a 10 jádra CPU A725. Tento CPU zvyšuje předběžné zpracování a orchestraci dat a zrychluje ladění modelů a infercingu v reálném čase. Architektura ARM přispívá k efektivnímu řízení a výkonu energie, takže je vhodný pro aplikace Edge AI.
- Paměť a propojení: Superchip GB10 nabízí 128 GB sjednocené koherentní paměti, což je nezbytné pro manipulaci s velkými modely AI. Používá NVIDIA NVLINK-C2C a poskytuje paměťový model soudržného CPU+GPU s výrazně vyšší šířkou pásma než tradiční rozhraní PCIE. Tato architektura zajišťuje bezproblémový přenos dat mezi CPU a GPU a optimalizuje jak tréninkové, tak inferenční úkoly.
Schopnosti školení a inference
- Trénink: Zatímco superchip GB10 není primárně navržen jako specializovaný tréninkový čip, jako je GPU Tesla Nvidia, zvládne prototypování a doladění modelů AI. Jeho vysoce výkonná kombinace GPU a CPU umožňuje vývojářům pracovat na menších až středně velkých modelech přímo na svých stolních počítačích. U větších modelů může být použit ve spojení s cloudovými službami pro rozsáhlejší tréninkové úkoly.
-Inference: GB10 Superchip vyniká v inferenčních úkolech, provádí předškolní modely efektivně, aby se rozhodovaly v reálném čase založené na nových datech. Jeho podpora pro přesnost FP4 a tenzorové jádra páté generace umožňuje rychlé a přesné zpracování modelů AI, což je ideální pro aplikace vyžadující rychlé odvození, jako je Edge AI, robotika a inteligentní zařízení IoT.
Škálovatelnost a nasazení
Oba číslice projektů i ASUS Ascent GX10 umožňují bezproblémové nasazení modelů AI z místních plochých prostředí po infrastrukturu cloudového nebo datového centra pomocí softwaru NVIDIA AI. To znamená, že vývojáři mohou prototypy modelů lokálně a poté je urychlit v cloudu bez významných úprav kódu, což usnadňuje efektivní iteraci a nasazení.
Stručně řečeno, superchip GB10 je navržen tak, aby posílilo vývojáře AI kompaktním, ale výkonným nástrojem pro školení i inferenční úkoly. I když je to více zaměřeno na odvození a prototypování, jeho schopnosti lze rozšířit integrací s cloudovými službami pro rozsáhlejší potřeby školení.
Citace:
[1] https://www.hyperstack.cloud/blog/thaked-leadership/nvidia-project-cil-you-need-to-bout-the-brackwell-i-sepercomputer
[2] https://www.nvidia.com/en-us/project-digits/
[3] https://www.marketscreener.com/quote/stock/asustek-computer-inc-6492304/news/asus-introduces-ascent-gx10-ai-supercomputer-powered-by-nvidia-gb10-backwell-superchip-4937233399/
[4] https://press.asus.com/news/press-releases/asus-inTroduces-ascent-gx-10-ai-supercomputer-povahad-by-nvidia-gb-10-rackwell-superchip/
[5] https://www.mediek.com/press-orom/mediek-collaborates-with-nvidia-on-thew-nvidia-gb10-grackwell-superchip-povaha--the-nvidia-project-conenal--ai-supercompsuter
[6] https://www.friendsofthemetaverse.com/blog/ai-Chips-expplaided-training-vs-Inference-Processors-Uveiled
[7] https://nvidianews.nvidia.com/news/nvidia-puts-race-lackwell-on-every-desk-and-at-every-ai-developers-fivertips
[8] https://www.reddit.com/r/deeplearning/comments/1hywfah/nvidia_project_digits_vs_rtx_5090_dilemma/
[9] https://meta-quantum.today/?p=3460
[10] https://newsroom.arm.com/blog/arm-nvidia-project-cigh-erformance-ai