DGX Spark, mille hiljuti Nvidia avalikustas, on kompaktne AI superarvuti, mis on mõeldud töölaua kasutamiseks, muutes selle kättesaadavaks paljudele arendajatele, teadlastele ja õpilastele. Selle toiteallikaks on Nvidia GB10 Grace Blackwell Superchip, mis hõlmab Blackwelli GPU-d, millel on viienda põlvkonna tensor-südamikud ja FP4 tugi. See konfiguratsioon võimaldab DGX Spark edastada kuni 1000 triljonit toimingut AI arvutuse sekundis (ülaosas), võimaldades sellel käsitleda AI-mudeleid kuni 200 miljardit parameetrit järelduste ja peenhäälestatud mudelite jaoks kuni 70 miljardit parameetrit [1] [3] [6].
Võrreldes teiste AI superarvutitega on DGX Spark kompaktse suuruse ja energiatõhususe poolest märkimisväärne, tarbides ainult 170W. See kasutab NVIDIA NVLINK-C2C ühendusühenduse tehnoloogiat, et pakkuda CPU+GPU-Coherent mälumudelit, pakkudes viis korda suuremat viienda põlvkonna PCIE ribalaiust. See suurendab mälumahukate AI töökoormuste jõudlust [1] [3] [6].
Kui DGX Spark on väikseim AI superarvuti, pakuvad suuremad süsteemid nagu DGX jaam võimsamaid võimalusi. DGX-jaamas, mille on välja kuulutanud ka NVIDIA, on GB300 Grace Blackwell Ultra Desktop Superchip koos 784 GB sidusa mäluruumiga, muutes selle sobivamaks suuremahuliste treeningute ja järelduste ülesannete jaoks [1] [4].
AI superarvutite laiemas maastikus on Cerebrase välja töötatud süsteemid nagu Andromeda, muljetavaldavad võimalused 13,5 miljoni tuuma ja jõudlusega exaflopi kaudu 16-bitise poole täpsusega. Andromeda on märkimisväärne oma kiire kokkupanemise aja ja kulutõhususe poolest võrreldes traditsiooniliste superarvutitega [2].
Superarvutite spektri ülaosas on sellised süsteemid nagu El Capitan, Frontier ja Aurora, mis on Exascale'i masinad, mis suudavad teha üle miljardi miljardi arvutuse sekundis. Neid superarvuteid kasutatakse peamiselt suuremahuliste teaduslike simulatsioonide ja AI-ülesannete jaoks, kuid need pole mõeldud töölaua kasutamiseks [5].
DGX Sparki ainulaadne väärtus seisneb selle võimes tuua töölaua keskkonda suure jõudlusega AI-arvutamine, võimaldades arendajatel enne pilve- või andmekeskuse infrastruktuuri skaleerimist minimaalsete koodimuutustega prototüübiga, peenhäälestada ja juurutada AI-mudeleid lokaalselt [1] [6]. See muudab selle atraktiivseks võimaluseks teadlastele ja arendajatele, kes vajavad võimsaid AI-võimalusi, ilma et oleks vaja suuremahulist andmekeskuse infrastruktuuri.
Tsitaadid:
]
]
]
]
[5] https://www.livescience.com/technology/computing/top-most-power-supercomputers
]
]
]
]