DGX Spark, gần đây được NVIDIA công bố, là một siêu máy tính AI nhỏ gọn được thiết kế để sử dụng máy tính để bàn, giúp nó có thể truy cập được với nhiều nhà phát triển, nhà nghiên cứu và sinh viên. Nó được cung cấp bởi NVIDIA GB10 Grace Blackwell Superchip, bao gồm GPU Blackwell với lõi tenor thế hệ thứ năm và hỗ trợ FP4. Cấu hình này cho phép DGX Spark cung cấp tới 1.000 nghìn tỷ hoạt động mỗi giây (TOPS) tính toán AI, cho phép nó xử lý các mô hình AI lên tới 200 tỷ tham số để suy luận và điều chỉnh các mô hình lên tới 70 tỷ thông số [1] [3] [6].
So với các siêu máy tính AI khác, DGX Spark đáng chú ý với kích thước và hiệu quả năng lượng nhỏ gọn của nó, chỉ tiêu thụ 170W. Nó sử dụng công nghệ kết nối NVIDIA NVLINK-C2C để cung cấp mô hình bộ nhớ kết nối CPU+GPU, cung cấp gấp năm lần băng thông của PCIe thế hệ thứ năm. Điều này giúp tăng cường hiệu suất cho khối lượng công việc AI tốn nhiều bộ nhớ [1] [3] [6].
Trong khi DGX Spark là siêu máy tính AI nhỏ nhất, các hệ thống lớn hơn như Trạm DGX cung cấp các khả năng mạnh mẽ hơn. Trạm DGX, cũng được NVIDIA công bố, có siêu năng BB300 Grace Blackwell Ultra Desktop với 784GB không gian bộ nhớ kết hợp, làm cho nó phù hợp hơn cho các nhiệm vụ đào tạo và suy luận quy mô lớn [1] [4].
Trong bối cảnh rộng lớn hơn của siêu máy tính AI, các hệ thống như Andromeda, được phát triển bởi Cerebras, tự hào với khả năng ấn tượng với 13,5 triệu lõi và hiệu suất trên exaflop ở độ chính xác 16 bit. Andromeda đáng chú ý về thời gian lắp ráp nhanh chóng và hiệu quả chi phí so với các siêu máy tính truyền thống [2].
Ở đầu trên cùng của phổ siêu máy tính là các hệ thống như El Capitan, Frontier và Aurora, là các máy exascale có khả năng thực hiện hơn một tỷ tỷ lệ tính mỗi giây. Các siêu máy tính này chủ yếu được sử dụng cho các mô phỏng khoa học quy mô lớn và các tác vụ AI nhưng không được thiết kế để sử dụng máy tính để bàn [5].
Giá trị độc đáo của DGX Spark nằm ở khả năng đưa điện toán AI hiệu suất cao vào môi trường máy tính để bàn, cho phép các nhà phát triển nguyên mẫu, tinh chỉnh và triển khai các mô hình AI cục bộ trước khi mở rộng lên cơ sở hạ tầng đám mây hoặc trung tâm dữ liệu với thay đổi mã tối thiểu [1] [6]. Điều này làm cho nó trở thành một lựa chọn hấp dẫn cho các nhà nghiên cứu và nhà phát triển, những người cần các khả năng AI mạnh mẽ mà không cần cơ sở hạ tầng trung tâm dữ liệu quy mô lớn.
Trích dẫn:
[1] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
.
.
[4] https://www.notebookcheck.net/Nvidia-unveils-DGX-Station-desktop-AI-supercomputer-with-72-core-CPU-and-Blackwell-Ultra-GPU.981669.0.html
[5] https://www.livescience.com/technology/computing/top-most-powerful-supercomputers
.
.
[8] https://qz.com/most-powerful-supercomputers-ai-research-1851725834
.