Cả NVIDIA GB10 Superchip và NVIDIA GB300 đều được thiết kế để tăng cường khả năng xử lý AI nhưng khác nhau đáng kể về kiến trúc, hiệu suất và các trường hợp sử dụng dự định.
Superchip GB10
Superchip GB10 dựa trên kiến trúc Nvidia Grace Blackwell và được tối ưu hóa cho các yếu tố hình thức máy tính để bàn nhỏ gọn. Nó có GPU Blackwell mạnh mẽ với các lõi tenor thế hệ thứ năm và hỗ trợ FP4, cung cấp tới 1.000 nghìn tỷ hoạt động mỗi giây (TOPS) sức mạnh xử lý AI [1] [3]. GB10 bao gồm CPU ARM 20 lõi, giúp tăng cường xử lý trước dữ liệu và điều phối, điều chỉnh mô hình tăng tốc và suy luận thời gian thực [1] [4]. Nó cung cấp 128GB bộ nhớ kết hợp thống nhất, cho phép các nhà phát triển quản lý các mô hình AI lên tới 200 tỷ tham số [1] [7]. GB10 là lý tưởng cho các nhà nghiên cứu và nhà phát triển AI cần tính toán AI mạnh mẽ trên máy tính để bàn của họ để tạo mẫu và tinh chỉnh các mô hình AI điều chỉnh [6] [7].
NVIDIA GB300
Ngược lại, NVIDIA GB300 được xây dựng với kiến trúc Grace Blackwell Ultra và được thiết kế để có khối lượng công việc AI đòi hỏi cao hơn, đặc biệt là trong môi trường doanh nghiệp. Nó có GPU Blackwell Ultra với các lõi tenor mới nhất và độ chính xác FP4, được kết nối với CPU NVIDIA Grace hiệu suất cao thông qua NVLink-C2C [3] [5]. GB300 cung cấp sự gia tăng đáng kể dung lượng bộ nhớ, với tới 288 GB HBM3E, hỗ trợ các mô hình lớn hơn trực tiếp trong bộ nhớ và giảm độ trễ cho các ứng dụng thời gian thực [2] [6]. Superchip này là một phần của trạm DGX, cung cấp một không gian bộ nhớ mạch lạc khổng lồ 784GB, làm cho nó phù hợp cho đào tạo quy mô lớn và khối lượng công việc suy luận [3] [6]. GB300 được tối ưu hóa cho cả các nhiệm vụ đào tạo và suy luận, với khả năng mạng nâng cao thông qua Card mạng CX8 và các mô -đun quang 1.6T, nhân đôi băng thông so với người tiền nhiệm của nó [2].
Sự khác biệt chính
- Hiệu suất và kiến trúc: GB10 cung cấp tối đa 1 hiệu suất AI, trong khi GB300 cung cấp sức mạnh tính toán cao hơn đáng kể, tập trung vào khối lượng công việc AI quy mô lớn hơn.
- Dung lượng bộ nhớ: GB10 có 128GB bộ nhớ thống nhất, trong khi GB300 cung cấp tới 288GB HBM3E và khi được tích hợp vào các hệ thống như trạm DGX, nó có thể cung cấp tới 784GB bộ nhớ kết hợp.
- Sử dụng dự định: GB10 được thiết kế để phát triển AI máy tính để bàn, lý tưởng cho các nhà nghiên cứu và nhà phát triển cần triển khai mô hình AI ngay lập tức. GB300 được nhắm mục tiêu vào môi trường doanh nghiệp, hỗ trợ nhu cầu cơ sở hạ tầng AI quy mô lớn.
- Mạng và Khả năng mở rộng: GB300 bao gồm các khả năng kết nối mạng nâng cao với Card mạng CX8, tăng gấp đôi băng thông, làm cho nó phù hợp hơn với các trung tâm dữ liệu quá mức và triển khai AI quy mô lớn. GB10 có thể kết nối hai hệ thống thông qua ConnectX-7 NIC để xử lý các mô hình lớn hơn nhưng không thể mở rộng như GB300 trong môi trường trung tâm dữ liệu lớn.
Trích dẫn:
[1] https://press.asus.com/news/press-releases
[2] https://drrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
.
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips