Superchip Nvidia GB10, представленная в таких устройствах, как Asus Ascent GX10 и Nvidia Project Digits, предназначен для обработки больших моделей искусственного интеллекта с параметрами до 200 миллиардов с помощью нескольких ключевых технологий и архитектурных функций:
1. Petaflop AI производительность: Superchip GB10 обеспечивает до 1 Petaflop вычисления ИИ, что имеет решающее значение для эффективной обработки больших моделей ИИ. Этот уровень производительности обеспечивает быстрое прототипирование, тонкую настройку и вывод сложных моделей ИИ [1] [4].
2. Единая память: чип включает в себя 128 ГБ объединенной, когерентной памяти. Эта единая архитектура памяти гарантирует, что как ЦП, так и графический процессор могут получить доступ к одному и тому же пространству памяти, значительно повышая эффективность передачи данных и снижая задержку. Это особенно важно для крупных моделей ИИ, которые требуют эффективной памяти для эффективной работы [3] [5].
3. Грейс Блэквелл Архитектура: Superchip GB10 построен на архитектуре Nvidia Grace Blackwell, которая сочетает в себе высокопроизводительный графический процессор Blackwell с 20-ядерным процессором Grace. Графический процессор Blackwell оснащен тензорными ядрами пятого поколения, которые оптимизированы для рабочих нагрузок ИИ, а ЦП Грейс улучшает задачи предварительной обработки данных и оркестровки [1] [4].
4. NVLINK-C2C Interconnect: The Chip использует технологию взаимодействия NVLINK-C2C от NVIDIA, которая обеспечивает соединение с высокой пропускной способностью между ЦП и графическим процессором. Это взаимосвязь предлагает в пять раз пропускную способность PCIE 5.0, обеспечивая бесшовную передачу данных и эффективное сотрудничество между ЦП и графическим процессором во время вычислений ИИ [1] [3].
5. Масштабируемость: для еще больших моделей две системы, оснащенные Superchip GB10, могут быть подключены с использованием сетевой технологии NVIDIA ConnectX. Это позволяет пользователям обрабатывать модели искусственного интеллекта с параметрами до 405 миллиардов, такие как Meta's Llama 3.1 модель [2] [6].
6. FP4 Точность: Superchip GB10 работает при точности FP4, что повышает скорость расчета за счет приближений. Этот уровень точности подходит для многих приложений для ИИ, предлагая баланс между производительностью и точностью [2] [4].
7. Совместимость программного обеспечения: Superchip GB10 полностью совместим со программным стеком NVIDIA AI, включая такие инструменты, как NEMO Framework для модели точной настройки и библиотеки Rapids для науки о данных. Эта совместимость гарантирует, что разработчики могут использовать широкий спектр инструментов и структур ИИ для оптимизации своих рабочих процессов [5] [6].
В целом, комбинация высокопроизводительных вычислений, эффективной архитектуры памяти и масштабируемого дизайна делает его идеальным решением для обработки крупных моделей искусственного интеллекта с параметрами до 200 миллиардов, демократизируя доступ к расширенным возможностям ИИ для разработчиков и исследователей.
Цитаты:
[1] https://press.asus.com/news/press-releases/asus-introduces-scent-gx-10-ai-supercomputer-power-by-nvidia-gb-10-grace-lackwell-superchip/
[2] https://www.theverge.com/2025/1/6/24337530/nvidia-ces-digits-super-computer-ai
[3] https://meta-quantum.today/?p=3460
[4] https://akihabaranews.com/nvidias-new-gb10-superchip/
[5] https://dataphoenix.info/nvidia-at-ces-2025-a-desktop-supercomputer-that-run-200b-parameter-llms//
[6] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-consabout-the-blackwell-ai-supercomputer
[7] https://www.engineering.com/nvidia-unveils-project-digits-personal-ai-supercomputer/
[8] https://www.reddit.com/r/ollama/comments/1hvplfw/new_nvidia_ai_pc_gb10_with_128g_vram_unified/
[9] https://www.techradar.com/pro/nvidia-unveils-a-blackwell-powered-mini-pc
[10] https://www.techeblog.com/nvidia-project-digits-smallest-ai-supercomputer/
[11] https://nvidianews.nvidia.com/news/nvidia-puts-grace-lackwell-on-every-desk-and-at-every-ai-developers-fingertips