O DGX Spark, recentemente revelado pela NVIDIA, é um supercomputador de IA compacto projetado para uso em desktop, tornando -o acessível a uma ampla gama de desenvolvedores, pesquisadores e estudantes. É alimentado pelo NVIDIA GB10 GRACE BLACKWELL SUPERCHIP, que inclui uma GPU Blackwell com núcleos de tensor de quinta geração e suporte a FP4. Essa configuração permite que o DGX Spark entregue até 1.000 trilhões de operações por segundo (tops) de computação de IA, permitindo que ele lide com modelos de IA de até 200 bilhões de parâmetros para inferência e modelos de ajuste fino de até 70 bilhões de parâmetros [1] [3] [6].
Em comparação com outros supercomputadores de IA, o DGX Spark é notável por seu tamanho compacto e eficiência de energia, consumindo apenas 170W. Ele usa a tecnologia de interconexão NVIDIA NVLink-C2C para fornecer um modelo de memória coerente de CPU+GPU, oferecendo cinco vezes a largura de banda do PCIE de quinta geração. Isso aprimora o desempenho para cargas de trabalho de IA intensivas em memória [1] [3] [6].
Enquanto o DGX Spark é o menor supercomputador de IA, sistemas maiores como a estação DGX oferecem recursos mais poderosos. A estação DGX, também anunciada pela NVIDIA, apresenta o Superchip GB300 Grace Blackwell Ultra Desktop com 784 GB de espaço coerente de memória, tornando-o mais adequado para tarefas de treinamento e inferência em larga escala [1] [4].
No cenário mais amplo da supercomputação de IA, sistemas como Andrômeda, desenvolvidos por cerebras, possuem recursos impressionantes com 13,5 milhões de núcleos e desempenho em um exaflop com meia precisão de 16 bits. Andrômeda é notável por seu rápido tempo de montagem e custo-efetividade em comparação com os supercomputadores tradicionais [2].
Na extremidade superior do espectro de supercomputação, existem sistemas como El Capitan, Frontier e Aurora, que são máquinas exascale capazes de executar mais de um bilhão de bilhões de cálculos por segundo. Esses supercomputadores são usados principalmente para simulações científicas de larga escala e tarefas de IA, mas não são projetadas para uso em desktop [5].
O valor exclusivo da DGX Spark está em sua capacidade de trazer computação de IA de alto desempenho para um ambiente de desktop, permitindo que os desenvolvedores prototipem, ajustem e implantem modelos de IA localmente antes de dimensionar para a infraestrutura de nuvem ou data center com alterações mínimas de código [1] [6]. Isso o torna uma opção atraente para pesquisadores e desenvolvedores que precisam de recursos poderosos de IA sem a necessidade de infraestrutura de data center em larga escala.
Citações:
[1] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
[2] https://singularityhub.com/2022/11/22/this-ai-supercomputer-has-13-5-million-cores-and-was-built-in-just-hhree-days/
[3] https://www.maginative.com/article/nvidia-unveils-dgx-park-and-dgx-station-desktop-ai-supercomputers-for-the-developer-masses/
[4] https://www.notebookcheck.net/nvidia-unveils-dgx-station-desktop-ai-supercomputer-with-72-core-cpu-e blackwell-ultra-gpu.981669.0.html
[5] https://www.livescience.com/technology/computing/top-mot-powerful-supercomputers
[6] https://www.engineering.com/nvidia-unveils-dgx-personal-ai-supercomputers-by-grace-blackwell/
[7] https://bgr.com/tech/nvidia-just-anounce-two-new-personal-ai-supercomputers/
[8] https://qz.com/emrowerful-supercomputers-ai-research-1851725834
[9] https://arstechnica.com/ai/2025/03/nvidia-announces-dgx-desktop-personal-ai-supercomputers/