Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Superchip GB10 xử lý các bộ dữ liệu lớn và các mô hình phức tạp


Superchip GB10 xử lý các bộ dữ liệu lớn và các mô hình phức tạp


GB10 SuperChip, một thành phần chính của các chữ số dự án của NVIDIA, được thiết kế để xử lý các bộ dữ liệu lớn và các mô hình AI phức tạp một cách hiệu quả. Đây là một tổng quan chi tiết về cách nó đạt được điều này:

Kiến trúc và các thành phần

Superchip GB10 dựa trên kiến ​​trúc Nvidia Grace Blackwell, kết hợp GPU NVIDIA Blackwell hiệu suất cao với CPU NVIDIA Grace 20 lõi được xây dựng trên kiến ​​trúc ARM. Thiết kế SOC này bao gồm các lõi CUDA thế hệ mới nhất và lõi tenor thế hệ thứ năm, rất quan trọng để tăng tốc tính toán AI [1] [4] [7]. GPU vượt trội khi xử lý song song cho đào tạo và suy luận mô hình AI, trong khi CPU xử lý các nhiệm vụ khác một cách hiệu quả [4].

Bộ nhớ và lưu trữ

Mỗi đơn vị Digits Digits có 128GB bộ nhớ hợp nhất, kết hợp, đảm bảo truy cập dữ liệu liền mạch cho các mô hình AI quy mô lớn và giảm độ trễ trong các buổi đào tạo [3] [6]. Ngoài ra, hệ thống bao gồm tối đa 4TB lưu trữ NVME, cung cấp tốc độ và công suất cần thiết để xử lý các bộ dữ liệu lớn và cho phép các hoạt động đọc/ghi nhanh [6] [7]. Sự kết hợp giữa bộ nhớ và lưu trữ này cho phép các nhà phát triển chạy các mô hình AI phức tạp với tới 200 tỷ tham số cục bộ [9].

Công nghệ kết nối

GB10 SuperChip sử dụng công nghệ kết nối chip-với chip NVLink-C2C, cung cấp kết nối băng thông thấp, có độ trễ thấp giữa GPU và CPU. Điều này cho phép truyền dữ liệu hiệu quả và giảm độ trễ, cho phép đường ống nhanh và hiệu suất mạnh mẽ [4] [7].

Mạng và khả năng mở rộng

Mạng NVIDIA ConnectX cho phép hai đơn vị số các chữ số dự án được liên kết với nhau, cho phép hỗ trợ các mô hình với tới 405 tỷ tham số. Tính năng khả năng mở rộng này là rất quan trọng để phát triển và triển khai các ứng dụng AI phức tạp, vì nó cho phép các nhà phát triển mở rộng quy mô các mô hình của họ để đáp ứng nhu cầu của các nhiệm vụ đòi hỏi [1] [3] [10].

Hiệu quả năng lượng

Sự hợp tác với MediaTek, một nhà lãnh đạo trong các thiết kế SOC dựa trên ARM, đã đóng góp cho hiệu quả, hiệu suất và kết nối sức mạnh tốt nhất trong lớp của GB10 Superchip. Điều này có nghĩa là các chữ số dự án có thể cung cấp hiệu suất mạnh mẽ chỉ bằng cách sử dụng một ổ cắm điện tiêu chuẩn, làm cho nó phù hợp cho việc sử dụng máy tính để bàn mà không phải chịu chi phí năng lượng đáng kể [4] [7].

Hỗ trợ phần mềm

Các chữ số dự án được tải sẵn với Full NVIDIA AI Enterprise Software Stack, bao gồm các thư viện, khung và các công cụ điều phối. Thiết lập này cho phép tích hợp liền mạch với cơ sở hạ tầng đám mây hoặc trung tâm dữ liệu, cho phép các nhà phát triển nguyên mẫu cục bộ và mở rộng các giải pháp của họ khi cần thiết [3] [10]. Hệ thống chạy trên hệ điều hành DGX dựa trên Linux, cung cấp một môi trường mạnh mẽ cho sự phát triển của AI [9].

Nhìn chung, sự kết hợp của Kiến trúc tiên tiến của GB10, bộ nhớ và lưu trữ hiệu quả, kết nối tốc độ cao và khả năng mạng có thể mở rộng khiến nó trở thành một lựa chọn lý tưởng để xử lý các bộ dữ liệu lớn và các mô hình AI phức tạp, đặc biệt là trong các ứng dụng như xử lý ngôn ngữ tự nhiên và tầm nhìn máy tính.

Trích dẫn:
.
[2] https://www.hostzealot.com/blog/news/ai-supercomputer-from-nvidia-that-can-run-200b-parameter-models
[3] https://hackernoon.com/project-digits-nvidias-leap-into-personal-ai-supercomputing
[4] https://dirox.com/post/nvidia-project-digits
.
.
.
.
[9] https://www.nvidia.com/en-us/project-digits/
[10] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-every-desk-and-at-every-ai-developers-fingertips