So sánh các siêu siêu GB10 và GB300 trong trạm DGX Spark và DGX cho điện toán AI

Kiến trúc CPU của Superchip GB10 trong DGX Spark khác với Superchip GB300 trong trạm DGX trong trạm DGX

Kiến trúc CPU của SuperChip GB10 trong DGX Spark và GB300 Superchip trong trạm DGX thể hiện sự khác biệt đáng kể phù hợp với các ứng dụng tương ứng của chúng trong điện toán AI.

Superchip GB10 trong DGX Spark

Superchip GB10 được thiết kế chủ yếu cho môi trường máy tính để bàn hiệu suất cao, nhỏ gọn. Nó có tính năng:

-Kiến trúc: GB10 được xây dựng trên kiến trúc ARMV9 và bao gồm cấu hình bộ xử lý 20 lõi, bao gồm mười lõi Cortex-X925 và mười lõi Cortex-A725. Thiết kế này nhấn mạnh sự cân bằng giữa hiệu suất cao và hiệu quả năng lượng, làm cho nó phù hợp cho việc sử dụng máy tính để bàn.

-Hiệu suất: GB10 cung cấp tới 1.000 nghìn tỷ hoạt động mỗi giây (TOPS) với GPU Blackwell tích hợp của nó, bao gồm lõi tenor thế hệ thứ năm và lõi RT thế hệ thứ tư. Khả năng này đặc biệt có lợi cho các nhiệm vụ suy luận AI và tinh chỉnh.

-Bộ nhớ và kết nối: Nó sử dụng công nghệ kết nối NVLink-C2C của NVIDIA, cung cấp mô hình bộ nhớ kết nối CPU+GPU với băng thông gấp năm lần so với PCIe 5.0. Hệ thống hỗ trợ 128 GB bộ nhớ LPDDR5X, cho phép xử lý hiệu quả khối lượng công việc sử dụng nhiều bộ nhớ.

- Trường hợp sử dụng mục tiêu: DGX Spark, được cung cấp bởi GB10, được tối ưu hóa cho các nhà phát triển và nhà nghiên cứu riêng lẻ, những người yêu cầu một giải pháp mạnh mẽ nhưng nhỏ gọn để phát triển và thử nghiệm mô hình AI.

Superchip GB300 trong trạm DGX

Ngược lại, Superchip GB300 được thiết kế cho các ứng dụng cấp độ trung tâm dữ liệu rộng rãi hơn:

- Kiến trúc: GB300 cũng kết hợp CPU GRACE với GPU Blackwell Ultra nhưng được tối ưu hóa cho các hoạt động quy mô lớn hơn. Mặc dù các cấu hình cốt lõi cụ thể không chi tiết, nhưng dự kiến sẽ tận dụng các nguyên tắc kiến trúc tương tự như GB10 nhưng với các cải tiến cho thông lượng và hiệu quả cao hơn.

- Hiệu suất: GB300 có thể đạt được tới 20 petaflops của hiệu suất AI, vượt qua đáng kể khả năng của GB10. Điều này làm cho nó phù hợp cho đào tạo quy mô lớn và khối lượng công việc suy luận đòi hỏi sức mạnh tính toán đáng kể.

- Bộ nhớ và kết nối: Hệ thống tự hào có bộ nhớ kết hợp 784 GB lớn, tích hợp LPDDR5X từ CPU và HBM3E từ GPU. Khả năng bộ nhớ rộng rãi này tạo điều kiện xử lý các bộ dữ liệu lớn và các mô hình phức tạp hiệu quả hơn. Công nghệ kết nối vẫn là NVLink-C2C, đảm bảo giao tiếp tốc độ cao giữa các thành phần CPU và GPU.

- Trường hợp sử dụng mục tiêu: Trạm DGX nhằm vào các tổ chức cần khả năng tính toán AI mạnh mẽ để đào tạo và triển khai mô hình rộng rãi, khiến các nhà nghiên cứu, nhà khoa học dữ liệu và nhà phát triển phần mềm làm việc trên các dự án AI quy mô lớn.

Tóm tắt sự khác biệt

Tóm lại, trong khi cả hai Superchip sử dụng các kiến trúc tiên tiến và công nghệ kết nối của NVIDIA, chúng được tối ưu hóa cho các môi trường khác nhau: GB10 tập trung vào hiệu suất nhỏ gọn phù hợp với từng người dùng, trong khi GB300 được thiết kế để đáp ứng nhu cầu của các hoạt động quy mô lớn hơn trong các cài đặt doanh nghiệp.

Trích dẫn:
[1] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
[2] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-unveils-dgx-station-workstation-pcs-gb300-blackwell-ultra-inside
.
.
[5] https://www.investing.com/news/company-news/nvidia-launches-personal-ai-supercomputers-for-desktops-93CH-3934971
[6] https://www.youtube.com/watch?v=KRBH0VON-2A
.
[8] https://www.theverge.com/news/631957/nvidia-dgx-spark-station-grace-blackwell-ai-supercomputers-gtc
[9] https://www.theverge.com/2024/2/1/24058186/ai-chips-meta-microsoft-google-nvidia
.
[11] https://www.theverge.com/news/631835/nvidia-blackwell-ultra-ai-chip-gb300
[12] https://www.pcmag.com/news/what-is-nvidias-dgx-station-a-new-specialized-desktop-line-for-ai-work