Nvidia Blackwell GPU는 몇 가지 주요 아키텍처 발전 및 기술을 활용하여 DGX Spark의 AI 성능을 크게 향상시킵니다. 다음은 Blackwell이 DGX Spark의 AI 기능 향상에 기여하는 방법에 대한 자세한 개요입니다.
아키텍처 및 디자인 **
1. 듀얼 디 설계 : Blackwell GPU는 10TB/S 칩 투 칩 상호 연결로 연결된 2 개의 레티클 제한 다이를 특징으로하며 단일 GPU 내에서 처리 전력을 효과적으로 두 배로 늘립니다. 이 설계는 복잡한 AI 작업에 중요한 병렬 처리 기능을 향상시킵니다 [2] [3].
2. TSMC 4NP 프로세스 : TSMC의 고급 4NP 공정을 사용하여 제작 된 Blackwell GPU에는 2,500 억 트랜지스터가 포함되어 있습니다. 이 높은 트랜지스터 밀도는 계산 전력과 효율을 증가시킬 수 있습니다 [2] [3].
성능 향상 **
1. 텐서 코어 및 변압기 엔진 : Blackwell GPU는 2 세대 변압기 엔진과 맞춤형 텐서 코어 기술로 구동됩니다. 이러한 발전은 대형 언어 모델 (LLM) 및 혼합 운동 모델에 대한 교육 및 추론을 가속화하여 AI 응용 분야에 대한 상당한 성능 향상을 제공합니다 [2] [8].
2. 5 세대 NVLINK : 최신 NVLINK 기술은 GPU 당 1.8TB/s의 양방향 처리량을 제공하여 여러 GPU 간의 고속 통신을 촉진합니다. 이것은 대규모 병렬 처리가 필요한 복잡한 AI 모델에 특히 유리합니다 [2] [3].
3. FP4 및 Microscaling Support : Blackwell GPU는 FP4 및 Microscaling Formats와 같은 새로운 정밀도를 지원하여 AI 계산의 정확성과 효율성을 향상시킵니다. 특히 생성 AI 작업 [8].
DGX 스파크 통합 **
NVIDIA GB10 GRACE BLACKWELL SUPERCHIP로 구동되는 DGX Spark는 Blackwell의 기능을 데스크탑 폼 팩터로 제공합니다. 이 통합을 통해 연구원과 개발자는 대규모 AI 모델을 로컬로 운영하고 개선하거나 최소한의 조정으로 클라우드 인프라에 배치 할 수 있습니다 [7].
1. CPU+GPU 일관성 : GB10 SuperChip은 NVLINK-C2C 상호 연결 기술을 사용하여 CPU+GPU 캐리 런트 메모리 모델을 제공합니다. 이것은 CPU와 GPU 간의 더 빠른 데이터 액세스를 허용하여 메모리 집약적 인 AI 워크로드를 크게 향상시킵니다 [7].
2. AI 처리 기능 : GB10 Superchip은 AI 처리를 위해 최대 1,000 개의 탑을 지원하여 NVIDIA COSMOS 이유 및 GR00T N1과 같은 기초 모델을 포함하여 AI 모델의 효율적인 미세 조정 및 추론을 가능하게합니다 [7].
보안 및 효율성 **
1. 고급 기밀 컴퓨팅 : Blackwell GPU는 고급 기밀 컴퓨팅 기능으로 최적화되어 AI 모델 및 고객 데이터가 성능을 손상시키지 않고 보호되도록합니다. 이것은 개인 정보에 민감한 산업에 중요합니다 [2] [3].
2. 전력 효율성 : 고성능에도 불구하고 Blackwell GPU는 운영 당 전력 소비를 줄이고 데이터 센터 및 데스크탑 환경에서보다 지속 가능한 AI 처리에 기여하도록 설계되었습니다 [2].
요약하면, NVIDIA Blackwell GPU는 비교할 수없는 처리 능력, 고급 텐서 코어 기술, 고속 상호 연결 및 개선 된 효율성을 제공함으로써 DGX Spark의 AI 성능을 향상시킵니다. 이러한 기능은 DGX Spark를 데스크탑에서 복잡한 AI 모델을 개발하고 정제하기위한 이상적인 플랫폼입니다.
인용 :
[1] https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-oa-- ai-- 족장-웨이 ---for-oge-of-ai-ai-ai--
[2] https://www.trgdatacenters.com/resource/nvidia-blackwell/
[3] https://www.hyperstack.cloud/blog/thoiting-leadership/everything-you-need-to- know-the-nvidia-blackwell-gpus
[4] https://www.amax.com/comparing-nvidia-blackwell-configurations/
[5] https://developer.nvidia.com/blog/nvidia-blackwell-delivers-world-record-deepseek-r1- inference-performance/
[6] https://datacrunch.io/blog/nvidia-blackwell-b100-b200-gpu
[7] https://www.engineering.com/nvidia-unveils-dgx-personal-ai-supercomputers-s-by-grace-blackwell/
[8] https://www.nvidia.com/en-us/data-center/technologies/blackwell-achitecture/
[9] https://www.nvidia.com/en-us/products/workstations/dgx-spark/