O NVIDIA GB10 Superchip e o NVIDIA GB300 são projetados para aprimorar os recursos de processamento de IA, mas diferem significativamente em sua arquitetura, desempenho e casos de uso pretendidos.
GB10 SUPERCHIP
O GB10 SuperChip é baseado na arquitetura NVIDIA GRACE BLACKWELL e é otimizado para fatores de forma compacta e desktop. Possui uma GPU Blackwell robusta com núcleos de tensores de quinta geração e suporte a FP4, fornecendo até 1.000 trilhões de operações por segundo (topo) do poder de processamento de IA [1] [3]. O GB10 inclui uma CPU de ARM de 20 núcleos, que aprimora o pré-processamento e a orquestração de dados, acelerando o ajuste do modelo e a inferência em tempo real [1] [4]. Oferece 128 GB de memória coerente unificada, permitindo que os desenvolvedores gerenciem modelos de IA de até 200 bilhões de parâmetros [1] [7]. O GB10 é ideal para pesquisadores e desenvolvedores de IA que precisam de computação poderosa de IA em seus desktops para prototipagem e modelos de IA de ajuste fino [6] [7].
NVIDIA GB300
Por outro lado, o NVIDIA GB300 é construído com a Grace Blackwell Ultra Architecture e foi projetado para cargas de trabalho de IA mais exigentes, principalmente em ambientes corporativos. Possui uma GPU Blackwell Ultra com os mais recentes núcleos de tensor e precisão FP4, conectada a uma NVIDIA GRACE CPU de alta eficiência via NVLink-C2C [3] [5]. O GB300 oferece um aumento substancial na capacidade da memória, com até 288 GB HBM3E, que suporta modelos maiores diretamente na memória e reduz a latência para aplicações em tempo real [2] [6]. Este superchip faz parte da estação DGX, que fornece 784 GB de espaço de memória coerente, tornando-o adequado para treinamento em larga escala e cargas de trabalho de inferência [3] [6]. O GB300 é otimizado para tarefas de treinamento e inferência, com recursos aprimorados de rede por meio da placa de rede CX8 e módulos ópticos de 1,6T, dobrando a largura de banda em comparação com seu antecessor [2].
Diferenças -chave
- Desempenho e arquitetura: o GB10 oferece até 1 petaflop do desempenho da IA, enquanto o GB300 oferece energia computacional significativamente maior, com foco em cargas de trabalho de IA em maior escala.
- Capacidade de memória: o GB10 possui 128 GB de memória unificada, enquanto o GB300 oferece até 288 GB de HBM3E e, quando integrados em sistemas como a estação DGX, pode fornecer até 784 GB de memória coerente.
- Uso pretendido: O GB10 foi projetado para desenvolvimento de IA da área de trabalho, ideal para pesquisadores e desenvolvedores que precisam de implantação imediata do modelo de IA. O GB300 é direcionado para ambientes corporativos, suportando necessidades de infraestrutura de IA em larga escala.
- Rede e escalabilidade: o GB300 inclui recursos avançados de rede com a placa de rede CX8, que dobra a largura de banda, tornando-o mais adequado para data centers de hiperescala e implantações de IA em larga escala. O GB10 pode conectar dois sistemas via NICs Connectx-7 para lidar com modelos maiores, mas não é tão escalável quanto o GB300 em grandes ambientes de data center.
Citações:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-blackwell-superchip/
[2] https://drrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
[4] https://www.bigdatawire.com/this-just-in/nvidia-unveils-project-digits-personal-ai-supercomputer/
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleases-the-future-with-personal-ai-supercomputers
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-wovery-dsk-and-at-every-ai-developers-fingertips