DGX Spark, récemment dévoilé par NVIDIA, est un supercalculateur d'IA compact conçu pour une utilisation de bureau, ce qui le rend accessible à un large éventail de développeurs, de chercheurs et d'étudiants. Il est alimenté par le Nvidia GB10 Grace Blackwell Superchip, qui comprend un GPU Blackwell avec des noyaux de tenseur de cinquième génération et un support FP4. Cette configuration permet à DGX Spark de livrer jusqu'à 1 000 billions d'opérations par seconde (sommet) de calcul d'IA, ce qui lui permet de gérer des modèles AI jusqu'à 200 milliards de paramètres pour les modèles d'inférence et d'adaptation jusqu'à 70 milliards de paramètres [1] [3] [6].
Par rapport à d'autres superordinateurs d'IA, DGX Spark est remarquable pour sa taille compacte et son efficacité électrique, ne consommant que 170 W. Il utilise la technologie d'interconnexion NVIDIA NVLINK-C2C pour fournir un modèle de mémoire cohérent CPU + GPU, offrant cinq fois la bande passante du PCIe de cinquième génération. Cela améliore les performances des charges de travail AI à forte intensité de mémoire [1] [3] [6].
Alors que DGX Spark est le plus petit supercalculateur d'IA, des systèmes plus grands comme la station DGX offrent des capacités plus puissantes. La station DGX, également annoncée par NVIDIA, dispose du GB300 Grace Blackwell Ultra Desktop Superchip avec 784 Go d'espace mémoire cohérent, ce qui le rend plus adapté aux tâches d'entraînement et d'inférence à grande échelle [1] [4].
Dans le paysage plus large du supercalcul en IA, des systèmes comme Andromède, développés par cerebras, offrent des capacités impressionnantes avec 13,5 millions de cœurs et des performances sur une exaflop à une demi-précision 16 bits. Andromède est remarquable pour son temps d'assemblage rapide et son rentabilité par rapport aux superordinateurs traditionnels [2].
À l'extrémité supérieure du spectre de supercalcul, se trouvent des systèmes comme El Capitan, Frontier et Aurora, qui sont des machines exascales capables d'effectuer plus d'un milliard de calculs par seconde. Ces superordinateurs sont principalement utilisés pour les simulations scientifiques à grande échelle et les tâches d'IA, mais ne sont pas conçues pour l'utilisation de bureau [5].
La valeur unique de DGX Spark réside dans sa capacité à apporter l'informatique de l'IA à haute performance à un environnement de bureau, permettant aux développeurs de prototyper, affiner et déployer des modèles AI localement avant de passer à l'infrastructure de cloud ou de centre de données avec des modifications de code minimales [1] [6]. Cela en fait une option attrayante pour les chercheurs et les développeurs qui ont besoin de capacités de l'IA puissantes sans avoir besoin d'infrastructures de centre de données à grande échelle.
Citations:
[1] https://nvidianews.nvidia.com/news/nvidia-annunces-dgx-spark-and-dgx-station-sersonal-ai-computers
[2] https://singularityhub.com/2022/11/22/this-ai-superccomputer-has-13-5-million-cares-and-was-built-in-just- trois jours/
[3] https://www.maginative.com/article/nvidia-unveils-dgx-scark-and-dgx-station-desktop-ai-supercomputers-for-the-developer-masses/
[4] https://www.notebookcheck.net/nvidia-unveils-dgx-station-desktop-ai-supercomputer-with-72-core-cpu-and-blackwell-ultra-gpu.981669.0.html
[5] https://www.livescience.com/technology/computing/top-most-lopperful-supercomputers
[6] https://www.engineering.com/nvidia-unveils-dgx-sersonal-ai-superccomputers-by-grace-blackwell/
[7] https://bgr.com/tech/nvidia-just-announced-two-new-personal-ai-supercomputers/
[8] https://qz.com/most-posteful-supercomputers-ai-research-1851725834
[9] https://arstechnica.com/ai/2025/03/nvidia-announs-dgx-desktop-personal-ai-superccomputers/