O NVIDIA GB10 SUPERCHIP, apresentado em dispositivos como os dígitos do ASUS Ascent GX10 e NVIDIA Project, foi projetado para lidar com grandes modelos de IA com até 200 bilhões de parâmetros por meio de várias tecnologias -chave e recursos arquitetônicos:
1. PETAFLOP AI DESEMPENHO: O GB10 Superchip oferece até 1 petaflop do desempenho da computação de IA, o que é crucial para o processamento de grandes modelos de IA com eficiência. Esse nível de desempenho permite prototipagem rápida, ajuste fino e inferência de modelos complexos de IA [1] [4].
2. Memória unificada: o chip inclui 128 GB de memória coerente unificada. Essa arquitetura de memória unificada garante que a CPU e a GPU possam acessar o mesmo espaço de memória, melhorando significativamente a eficiência da transferência de dados e reduzindo a latência. Isso é particularmente importante para grandes modelos de IA que requerem memória substancial para operar efetivamente [3] [5].
3. Arquitetura Grace Blackwell: O GB10 Superchip é construído sobre a arquitetura Nvidia Grace Blackwell, que combina uma GPU Blackwell de alto desempenho com uma CPU Grace de 20 núcleos. A Blackwell GPU possui núcleos de tensor de quinta geração, que são otimizados para cargas de trabalho de IA, e a CPU GRACE aprimora as tarefas de pré-processamento e orquestração de dados [1] [4].
4. Interconexão NVLink-C2C: o chip usa a tecnologia de interconexão NVLink-C2C da NVIDIA, que fornece uma conexão de alta largura de banda entre a CPU e a GPU. Essa interconexão oferece cinco vezes a largura de banda do PCIE 5.0, garantindo transferência de dados perfeita e colaboração eficiente entre a CPU e a GPU durante os cálculos de IA [1] [3].
5. Escalabilidade: Para modelos ainda maiores, dois sistemas equipados com o GB10 SuperChip podem ser conectados usando a tecnologia NVIDIA ConnectX Networking. Isso permite que os usuários lidem com modelos de IA com até 405 bilhões de parâmetros, como o modelo LLAMA 3.1 da Meta [2] [6].
6. Precisão do FP4: O Superchip GB10 opera na precisão do FP4, o que aumenta a velocidade de cálculo através de aproximações. Esse nível de precisão é adequado para muitas aplicações de IA, oferecendo um equilíbrio entre desempenho e precisão [2] [4].
7. Compatibilidade de software: O GB10 SuperChip é totalmente compatível com a pilha de software da AI da NVIDIA, incluindo ferramentas como a estrutura Nemo para o modelo de ajuste fino e bibliotecas de corredeiras para ciência de dados. Essa compatibilidade garante que os desenvolvedores possam aproveitar uma ampla gama de ferramentas e estruturas de IA para otimizar seus fluxos de trabalho [5] [6].
No geral, a combinação de computação de alto desempenho do GB10 Superchip, arquitetura de memória eficiente e design escalável o tornam uma solução ideal para lidar com grandes modelos de IA com até 200 bilhões de parâmetros, democratizando o acesso a recursos avançados de computação de IA para desenvolvedores e pesquisadores.
Citações:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-blackwell-superchip/
[2] https://www.theverge.com/2025/1/6/24337530/nvidia-ces-digits-super-comput-ai
[3] https://meta-quantum.today/?p=3460
[4] https://akihabaranews.com/nvidias-new-gb10-superchip/
[5] https://dataphoenix.info/nvidia-at-ces-2025-desktop-supercomputer-that--an-run-200b-parameter-llms/
[6] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-know-about-the-Blackwell-Ai-Supercomputer
[7] https://www.engineering.com/nvidia-unveils-project-digits-personal-ai-supercomputer/
[8] https://www.reddit.com/r/ollama/comments/1hvplfw/new_nvidia_ai_pc_gb10_with_128g_vram_unifed/
[9] https://www.techrarvar.com/pro/nvidia-unveils-a-blackwell-powowered-mini-pc
[10] https://www.techeblog.com/nvidia-project-digits-smalest-ai-supercomputer/
[11] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-an-wovery-desk-and-at-waver-ai-developers-fingertips