NVIDIA DGX Spark và Nvidia Geforce RTX 4090 là hai hệ thống điện toán riêng biệt được thiết kế cho các mục đích khác nhau, dẫn đến sự khác biệt đáng kể trong kiến trúc của chúng.
Kiến trúc CPU
- DGX Spark: Nó được cung cấp bởi NVIDIA GB10 SOC, có bộ xử lý ARMV9 20 lõi. Điều này bao gồm mười lõi Cortex-X925 và mười lõi Cortex-A725, được thiết kế để xử lý AI hiệu suất cao và các nhiệm vụ điện toán chung [1] [4].- RTX 4090: GPU này không có CPU chuyên dụng; Thay vào đó, nó là một đơn vị xử lý đồ họa (GPU) được thiết kế để hoạt động với CPU máy chủ. Nó dựa trên kiến trúc ADA Lovelace, cụ thể là GPU AD102, được tối ưu hóa để chơi game và khối lượng công việc đồ họa [2] [5].
Kiến trúc GPU
- DGX Spark: GPU trong DGX Spark dựa trên kiến trúc Blackwell, một phần của Nvidia Grace Blackwell Superchip. Nó được tối ưu hóa cho khối lượng công việc AI, cung cấp tới 1.000 đỉnh của hiệu suất AI [1] [7].- RTX 4090: RTX 4090 có kiến trúc ADA Lovelace, bao gồm 16.384 lõi CUDA, lõi theo dõi tia 128 và lõi tenor 512. Kiến trúc này chủ yếu tập trung vào chơi game, truy tìm tia và các tác vụ điện toán hiệu suất cao [2] [8].
bộ nhớ và băng thông
- DGX Spark: Nó sử dụng 128 GB bộ nhớ LPDDR5X 256 bit, cung cấp băng thông bộ nhớ là 273 GB/s. Hệ thống này cũng sử dụng công nghệ kết nối NVIDIA NVLINK-C2C để tăng cường giao tiếp CPU-GPU, cung cấp năm lần băng thông của PCIe 5.0 [1] [4].- RTX 4090: RTX 4090 đi kèm với 24 GB bộ nhớ GDDR6X và băng thông bộ nhớ là 1008 GB/s. Nó sử dụng giao diện PCIe 4.0 x16 để kết nối với hệ thống máy chủ [2] [5].
Tensor Cores và AI Performance
- DGX Spark: Được trang bị lõi tenxơ thế hệ thứ 5, DGX Spark được tối ưu hóa cho các nhiệm vụ AI, cung cấp tới 1.000 đỉnh của hiệu suất AI. Điều này làm cho nó phù hợp để đào tạo và suy luận của các mô hình AI lớn [1] [7].- RTX 4090: Mặc dù chủ yếu là GPU chơi game, RTX 4090 bao gồm các lõi tenor thế hệ thứ 4, giúp tăng cường khả năng của nó cho các nhiệm vụ AI và máy học. Tuy nhiên, hiệu suất AI của nó không cao như các hệ thống AI chuyên dụng như DGX Spark [2] [8].
Mạng và kết nối
- DGX Spark: Nó có cổng 10GBE RJ45 thông qua ConnectX-7 Smart NIC, WiFi 7, Bluetooth 5.3 và bốn cổng USB4. ConnectX-7 cho phép các khả năng kết nối mạng có thể kết nối hai hệ thống tia lửa DGX cho các mô hình AI lớn hơn [1] [4].- RTX 4090: Là GPU, nó không có khả năng kết nối mạng tích hợp mà dựa vào các tùy chọn kết nối của hệ thống máy chủ. Nó kết nối thông qua giao diện PCIe 4.0 [2] [5].
Tóm lại, DGX Spark được thiết kế như một siêu máy tính AI nhỏ gọn, tập trung vào xử lý và nghiên cứu AI, trong khi RTX 4090 là GPU hiệu suất cao được tối ưu hóa cho khối lượng công việc chơi game và đồ họa.
Trích dẫn:
.
[2] https://www.itcreations.com/nvidia-gpu/nvidia-geforce-rtx-4090-gpu
[3] https://www.fibermall.com/blog/nvidia-a100-vs-4090.htm
[4] https://www.pcmag.com/news/what-is-nvidias-dgx-station-a-new-specialized-desktop-line-for-ai-work
[5] https://www.techpowerup.com/review/nvidia-geforce-rtx-4090-founders-edition/2.html
.
[7] https://www.constellationr.com/blog-news/insights/nvidia-launches-dgx-spark-dgx-station-personal-ai-supercomputers
[8] https://coinpoet.com/ml/learn/gpu/nvidia-geforce-rtx-4090
[9] https://images.nvidia.com/aem-dam/Solutions/geforce/ada/nvidia-ada-gpu-architecture.pdf