DGX Spark, recentemente svelato da Nvidia, è un supercomputer AI compatto progettato per l'uso desktop, che lo rende accessibile a una vasta gamma di sviluppatori, ricercatori e studenti. È alimentato dalla Nvidia GB10 Grace Blackwell Superchip, che include una GPU Blackwell con nuclei di tensore di quinta generazione e supporto FP4. Questa configurazione consente a DGX Spark di offrire fino a 1.000 trilioni di operazioni al secondo (top) di AI Calcole, consentendole di gestire modelli AI fino a 200 miliardi di parametri per inferenza e modelli di perfezionamento fino a 70 miliardi di parametri [1] [3] [6].
Rispetto ad altri supercomputer AI, DGX Spark è notevole per le sue dimensioni compatte e l'efficienza energetica, consumando solo 170 W. Utilizza la tecnologia InterConnect NVIDIA NVLink-C2C per fornire un modello di memoria coerente GPU CPU+, offrendo cinque volte la larghezza di banda della PCIe di quinta generazione. Ciò migliora le prestazioni per i carichi di lavoro AI ad alta intensità di memoria [1] [3] [6].
Mentre DGX Spark è il supercomputer AI più piccolo, sistemi più grandi come la stazione DGX offrono capacità più potenti. La stazione DGX, anch'essa annunciata da Nvidia, presenta il Superchip desktop Ultra Grace Blackwell GB300 Blackwell con 784 GB di spazio di memoria coerente, che lo rende più adatto per le attività di addestramento e inferenza su larga scala [1] [4].
Nel più ampio panorama di AI Supercomputing, sistemi come Andromeda, sviluppati da Cerebras, vantano capacità impressionanti con 13,5 milioni di core e prestazioni su un exaflop a mezza precisione a 16 bit. Andromeda è notevole per il suo rapido tempo di assemblaggio e il costo-efficacia rispetto ai supercomputer tradizionali [2].
Nella parte superiore dello spettro di supercomputing ci sono sistemi come El Capitan, Frontier e Aurora, che sono macchine Exascale in grado di eseguire oltre un miliardo di miliardi di calcoli al secondo. Questi supercomputer sono utilizzati principalmente per simulazioni scientifiche su larga scala e attività di intelligenza artificiale ma non sono progettati per l'uso del desktop [5].
Il valore unico di DGX Spark risiede nella sua capacità di portare al calcolo AI ad alte prestazioni in un ambiente desktop, consentendo agli sviluppatori di prototipo, perfezionare e distribuire i modelli AI a livello locale prima di ridimensionare l'infrastruttura cloud o di data center con variazioni minime di codice [1] [6]. Questo lo rende un'opzione interessante per i ricercatori e gli sviluppatori che hanno bisogno di potenti capacità di intelligenza artificiale senza la necessità di infrastrutture di data center su larga scala.
Citazioni:
[1] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computer
[2] https://singularityhub.com/2022/11/11/11
[3] https://www.maginative.com/article/nvidia-unveils-dgx-spark-and-dgx-desktop-ai-supercomputers-for-the-developer-masses/
[4] https://www.notebookcheck.net/nvidia-unveils-dgx-station-desktop-aa-supercomputer-with-72-core-cpu-and-blackwell-ultra-gpu.981669.0.html
[5] https://www.livescience.com/technology/computing/top-most-powerful-supercomputer
[6] https://www.engineering.com/nvidia-unveils-dgx-personal-ai-supercomputers-by-grace-blackwell/
[7] https://bgr.com/tech/nvidia-just-announced-two-new-personal-ai-supercomputer/
[8] https://qz.com/most-powerfulfulfulcomputers-ai-research-1851725834
[9] https://arstechnica.com/ai/2025/03/nvidia-announces-dgx-desktop-personal-ai-supercomputer/