NVIDIA DGX -stationen og tidligere DGX -modeller, såsom DGX -stationen A100 og den ældre DGX -station med Tesla V100 GPU'er, udviser betydelige forskelle i hukommelsesbåndbredde og samlet arkitektur.
DGX Station (ny model)
Den nye DGX-station er udstyret med GB300 Grace Blackwell Ultra Desktop Superchip, der inkluderer en 72-core Grace CPU og en Blackwell Ultra GPU. Dette system har op til 288 GB HBM3E GPU -hukommelse og op til 496 GB LPDDR5X CPU -hukommelse. Hukommelsesbåndbredden for GPU -hukommelsen er ikke eksplicit angivet med hensyn til GB/S, men systemet understøtter op til 8 TB/s hukommelsesbåndbredde, hvilket er væsentligt højere end tidligere modeller. CPU -hukommelsesbåndbredden er op til 396 GB/s ** [5] [8].DGX Station A100
DGX -stationen A100 bruger fire NVIDIA A100 SXM4 GPU'er, hver med enten 40 GB eller 80 GB HBM2 -hukommelse. Mens den specifikke hukommelsesbåndbredde for denne model ikke er detaljeret, er A100 GPU'er kendt for deres høje hukommelsesbåndbredde, typisk omkring 1.555 GB/s pr. GPU for HBM2 -hukommelsen, hvilket ville i alt i alt til ca. 6.220 GB/s for hele systemet [10].DGX Station med Tesla V100 GPU'er
Den ældre DGX -stationsmodel med fire Tesla V100 GPU'er har 16 GB HBM2 -hukommelse pr. GPU, i alt 64 GB GPU -hukommelse. Hukommelsesbåndbredden for hver V100 GPU er 900 GB/s, hvilket resulterer i en total GPU -hukommelsesbåndbredde på 3,6 TB/s. Derudover inkluderer systemet 256 GB DDR4 -systemhukommelse, men dets båndbredde er ikke så høj som GPU -hukommelsen [2] [9].Nøgleforskelle
- Hukommelsestype og båndbredde: Den nye DGX -station bruger HBM3E til GPU -hukommelse, hvilket tilbyder signifikant højere båndbredde sammenlignet med HBM2, der bruges i ældre modeller. CPU -hukommelsesbåndbredden forbedres også med LPDDR5X.- Arkitektur: Den nye DGX -station integrerer en Grace CPU med en Blackwell Ultra GPU, der giver en mere sammenhængende og effektiv arkitektur for AI -arbejdsbelastninger sammenlignet med tidligere modeller.
- Skalerbarhed: Den nye DGX-station er designet til at understøtte mere omfattende AI-arbejdsbelastning med dens højere hukommelseskapacitet og hurtigere sammenkoblinger som NVLINK-C2C, der tilbyder syv gange båndbredden af PCIe Gen 5 [5] [8].
Citater:
[1] https://www.reddit.com/r/localllama/comments/1jedy17/nvidia_digits_specs_released_and_renamed_to_dgx/
[2] https://images.nvidia.com/content/newsletters/email/pdf/dgx-station-wp.pdf
[3] https://opentools.ai/news/nvidia-unleashes-future-with-personal-i-supercomputers
[4] https://www.youtube.com/watch?v=krbh0von-2a
)
[6] https://docs.nvidia.com/dgx/dgxa100-user-guide/introduktion-to-dgxa100.html
)
[8] https://www.nvidia.com/en-us/products/workstations/dgx-station/
[9] https://xenon.com.au/product/nvidia-dgx-station/
[10] https://mcomputers.cz/en/products-and-services/nvidia/dgx-systems/nvidia-dgx-station-a100/