O NVIDIA GB10 Grace Blackwell Superchip foi projetado para lidar com tarefas de aprendizado de máquina com eficiência e energia excepcionais. É um componente essencial dos dígitos do projeto da NVIDIA, um supercomputador de IA pessoal que visa democratizar o acesso à computação de IA de alto desempenho para pesquisadores, cientistas de dados e estudantes.
Principais recursos para aprendizado de máquina
- Desempenho da IA: o GB10 Superchip oferece até 1 Petaflop of AI Performance na FP4 Precision, tornando -o capaz de executar grandes modelos de IA com até 200 bilhões de parâmetros. Esse nível de desempenho é crucial para tarefas complexas de aprendizado de máquina, como processamento de linguagem natural e visão computacional [1] [3] [5].
-Arquitetura: O Superchip é baseado na arquitetura Nvidia Grace Blackwell, combinando uma GPU da NVIDIA Blackwell com os núcleos CUDA de última geração e núcleos de tensor de quinta geração. Esses componentes são essenciais para acelerar os cálculos de aprendizado de máquina [1] [5].
-Integração da CPU e GPU: o GB10 Superchip inclui uma CPU NVIDIA GRACE de alto desempenho com 20 núcleos eficientes em termos de potência construídos na arquitetura do ARM. Esta CPU está conectada à GPU via interconexão NVLink-C2C Chip-T-Chip, permitindo a transferência de dados de alta velocidade entre a CPU e a GPU, o que é vital para o treinamento e inferência eficientes do modelo de aprendizado de máquina [1] [7].
- Memória e armazenamento: possui 128 GB de memória unificada e coerente e até 4 TB de armazenamento NVME. Essa ampla capacidade de memória e armazenamento permitem o manuseio de grandes conjuntos de dados e modelos complexos, que são comuns em aplicações de aprendizado de máquina [1] [3].
- Escalabilidade: para tarefas ainda mais exigentes, duas unidades de dígitos do projeto podem ser vinculadas usando a rede NVIDIA ConnectX, permitindo que elas executem modelos com até 405 bilhões de parâmetros. Essa escalabilidade é benéfica para projetos de aprendizado de máquina em larga escala que exigem computação distribuída [1] [3].
Aplicativos de aprendizado de máquina
O GB10 SuperChip é adequado para vários aplicativos de aprendizado de máquina, incluindo:
- AI generativa: pode lidar com modelos generativos complexos usados em tarefas como imagem e geração de texto.
- Modelagem e Animação 3D: O SuperChip suporta tarefas que requerem alta potência computacional, como renderização e simulação em ambientes 3D.
- Modelos de idiomas grandes: com a capacidade de executar modelos de até 200 bilhões de parâmetros, é ideal para tarefas de processamento de linguagem natural, como tradução de idiomas e resumo de texto [1] [4].
Desenvolvimento e implantação
Os dígitos do projeto permitem que os usuários desenvolvam e executem inferência nos modelos usando seu próprio sistema de desktop e, em seguida, implantam -os perfeitamente na infraestrutura acelerada de nuvem ou data center. Esse fluxo de trabalho de ponta a ponta é suportado pela plataforma de software Enterprise AI da NVIDIA, que inclui ferramentas como Pytorch e Jupyter Notebooks para desenvolvimento e implantação de modelos [1] [7].
No geral, o GB10 SuperChip foi projetado para capacitar os desenvolvedores a protótipos, ajustar e implantar modelos de IA localmente antes de ampliá-los em infraestrutura em nuvem ou data center, tornando-o uma ferramenta poderosa para tarefas de aprendizado de máquina.
Citações:
[1] https://quantumzeitgeist.com/nvidia-unveils-smalest-ai-supercomputer-for-developers- everywhere/
[2] https://news.ycombinator.com/item?id=42619139
[3] https://akihabaranews.com/nvidias-new-gb10-superchip/
[4] https://www.hp.com/us-en/workstations/workstation-pcs.html
[5] https://www.elektormagazine.com/news/project-digits-nvidia-unveils-personal-ai-supercomputer
[6] https://opentools.ai/news/nvidia-unleases-the-future-with-personal-ai-supercomputers
[7] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-wovery-dsk-and-at-ever-ai-developers-fingertips
[8] https://www.guru3d.com/news/page-2017/
[9] https://meta-quantum.today/?p=3460
[10] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-know-about-the-Blackwell-Ai-Supercomputer
[11] https://www.nvidia.com/en-us/project-digits/