Le NVIDIA GB10 Superchip et le NVIDIA GB300 sont tous deux conçus pour améliorer les capacités de traitement de l'IA mais diffèrent considérablement par leur architecture, leurs performances et leurs cas d'utilisation prévus.
GB10 Superchip
La superchip GB10 est basée sur l'architecture Nvidia Grace Blackwell et est optimisée pour les facteurs compacts de forme de bureau. Il dispose d'un GPU Blackwell robuste avec des noyaux de tenseur de cinquième génération et un support FP4, offrant jusqu'à 1 000 billions d'opérations par seconde (sommet) de la puissance de traitement de l'IA [1] [3]. Le GB10 comprend un CPU ARM à 20 cœurs, qui améliore le prétraitement des données et l'orchestration, l'accélération du réglage du modèle et de l'inférence en temps réel [1] [4]. Il offre 128 Go de mémoire cohérente unifiée, permettant aux développeurs de gérer les modèles d'IA jusqu'à 200 milliards de paramètres [1] [7]. Le GB10 est idéal pour les chercheurs et les développeurs d'IA qui ont besoin d'un calcul de l'IA puissant sur leurs ordinateurs de bureau pour le prototypage et les modèles d'IA à réglage fin [6] [7].
nvidia gb300
En revanche, le NVIDIA GB300 est construit avec l'architecture Grace Blackwell Ultra et est conçu pour des charges de travail IA plus exigeantes, en particulier dans les environnements d'entreprise. Il dispose d'un Blackwell Ultra GPU avec les derniers noyaux de tenseur et la précision FP4, connecté à un CPU NVIDIA Grace haute performance via NVLink-C2C [3] [5]. Le GB300 offre une augmentation substantielle de la capacité de mémoire, avec jusqu'à 288 Go HBM3E, qui prend en charge les modèles plus importants directement en mémoire et réduit la latence pour les applications en temps réel [2] [6]. Cette superchip fait partie de la station DGX, qui fournit un énorme 784 Go d'espace mémoire cohérent, ce qui le rend adapté à des charges de travail à grande échelle et à l'inférence [3] [6]. Le GB300 est optimisé pour les tâches de formation et d'inférence, avec des capacités de réseau améliorées via la carte réseau CX8 et les modules optiques de 1,6 t, doublant la bande passante par rapport à son prédécesseur [2].
Différences clés
- Performance et architecture: Le GB10 offre jusqu'à 1 Petaflop de performances AI, tandis que le GB300 offre une puissance de calcul nettement plus élevée, en mettant l'accent sur les charges de travail d'IA à plus grande échelle.
- Capacité de mémoire: le GB10 a 128 Go de mémoire unifiée, tandis que le GB300 offre jusqu'à 288 Go de HBM3E, et lorsqu'il est intégré dans des systèmes comme la station DGX, il peut fournir jusqu'à 784 Go de mémoire cohérente.
- Utilisation prévue: Le GB10 est conçu pour le développement d'IA de bureau, idéal pour les chercheurs et les développeurs ayant besoin d'un déploiement immédiat du modèle d'IA. Le GB300 est destiné aux environnements d'entreprise, en répondant aux besoins d'infrastructure d'IA à grande échelle.
- Réseautage et évolutivité: Le GB300 comprend des capacités de mise en réseau avancées avec la carte réseau CX8, qui double la bande passante, ce qui le rend plus adapté aux centres de données hyperscale et aux déploiements d'IA à grande échelle. Le GB10 peut connecter deux systèmes via ConnectX-7 NICS pour gérer des modèles plus grands, mais n'est pas aussi évolutif que le GB300 dans de grands environnements de centre de données.
Citations:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-blackwell-superchip/
[2] https://drrrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3] https://nvidianews.nvidia.com/news/nvidia-annouces-dgx-spark-and-dgx-station-personal-ai-computers
[4] https://www.bigdatawire.com/this-just-in/nvidia-unveils-project-digits-personal-ai-superccomputer/
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-sersonal-ai-supercomputers
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-develovers-fingertips