NVIDIA GB10 Superchip: Cách mạng hóa máy tính AI với hiệu suất petaflop

Superchip GB10 xử lý các mô hình AI lớn như thế nào với tối đa 200 tỷ thông số

NVIDIA GB10 Superchip, đặc trưng trong các thiết bị như ASUS Ascent GX10 và NVIDIA Project Digits, được thiết kế để xử lý các mô hình AI lớn với tới 200 tỷ tham số thông qua một số công nghệ chính và các tính năng kiến trúc:

1. Hiệu suất AI của Petaflop: Superchip GB10 cung cấp tối đa 1 petaflop của hiệu suất điện toán AI, rất quan trọng để xử lý các mô hình AI lớn một cách hiệu quả. Mức độ hiệu suất này cho phép tạo mẫu nhanh, tinh chỉnh và suy luận của các mô hình AI phức tạp [1] [4].

2. Bộ nhớ thống nhất: Chip bao gồm 128GB bộ nhớ hợp nhất, kết hợp. Kiến trúc bộ nhớ thống nhất này đảm bảo rằng cả CPU và GPU đều có thể truy cập cùng một không gian bộ nhớ, cải thiện đáng kể hiệu quả truyền dữ liệu và giảm độ trễ. Điều này đặc biệt quan trọng đối với các mô hình AI lớn đòi hỏi bộ nhớ đáng kể để hoạt động hiệu quả [3] [5].

3. Kiến trúc Grace Blackwell: Superchip GB10 được xây dựng trên Kiến trúc Nvidia Grace Blackwell, kết hợp GPU Blackwell hiệu suất cao với CPU Grace dựa trên cánh tay 20 lõi. GPU Blackwell có các lõi tenor thế hệ thứ năm, được tối ưu hóa cho khối lượng công việc AI và CPU Grace tăng cường các nhiệm vụ tiền xử lý và điều phối dữ liệu [1] [4].

4. Kết nối NVLink-C2C: chip sử dụng công nghệ kết nối NVLink-C2C của NVIDIA, cung cấp kết nối băng thông cao giữa CPU và GPU. Kết nối này cung cấp năm lần băng thông của PCIe 5.0, đảm bảo truyền dữ liệu liền mạch và sự hợp tác hiệu quả giữa CPU và GPU trong các tính toán AI [1] [3].

5. Khả năng mở rộng: Đối với các mô hình thậm chí còn lớn hơn, hai hệ thống được trang bị SuperChip GB10 có thể được kết nối bằng công nghệ mạng NVIDIA ConnectX. Điều này cho phép người dùng xử lý các mô hình AI với tối đa 405 tỷ tham số, chẳng hạn như Model Llama 3.1 của Meta [2] [6].

6. Độ chính xác của FP4: Superchip GB10 hoạt động ở độ chính xác của FP4, giúp tăng cường tốc độ tính toán thông qua các xấp xỉ. Mức độ chính xác này phù hợp với nhiều ứng dụng AI, cung cấp sự cân bằng giữa hiệu suất và độ chính xác [2] [4].

7. Khả năng tương thích phần mềm: SuperChip GB10 hoàn toàn tương thích với ngăn xếp phần mềm AI của NVIDIA, bao gồm các công cụ như NEMO Framework cho các thư viện tinh chỉnh mô hình và Rapids cho khoa học dữ liệu. Khả năng tương thích này đảm bảo rằng các nhà phát triển có thể tận dụng một loạt các công cụ và khung AI để tối ưu hóa quy trình công việc của họ [5] [6].

Nhìn chung, sự kết hợp của tính toán hiệu suất cao của GB10, kiến trúc bộ nhớ hiệu quả và thiết kế có thể mở rộng khiến nó trở thành một giải pháp lý tưởng để xử lý các mô hình AI lớn với tới 200 tỷ thông số, dân chủ hóa quyền truy cập vào khả năng tính toán AI tiên tiến cho các nhà phát triển và nghiên cứu.

Trích dẫn:
[1] https://press.asus.com/news/press-releases
[2] https://www.theverge.com/2025 /1/6/24337530
[3] https://meta-quantum.today/?p=3460
[4] https://akihabaranews.com/nvidias-new-gb10-superchip/
.
[6] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-to-know-about-the-blackwell-ai-supercomputer
.
.
[9] https://www.techradar.com/pro/nvidia-unveils-a-blackwell-powered-mini-pc
.
[11] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips