محطة NVIDIA DGX هي نظام حوسبة قوي من الذكاء الاصطناعي مصمم لتقديم أداء على مستوى مركز البيانات في عامل شكل سطح المكتب. إنه يتميز بـ Grace Grace Advanced Grace Blackwell Ultra سطح المكتب ومساحة ذاكرة متماسكة 784 جيجابايت ، وهو أمر بالغ الأهمية للتدريب على نموذج الذكاء الاصطناعي على نطاق واسع. لا يتم ذكر عرض النطاق الترددي للذاكرة لمحطة DGX بشكل صريح في أحدث المواصفات ، ولكن من المعروف أنه يستخدم تقنيات ذاكرة عالية النطاق مثل NVLink-C2C لنقل البيانات الفعال بين وحدات المعالجة المركزية والوحدات المعالجة المركزية.
وبالمقارنة ، كان سابق محطة DGX ، التي استخدمت Tesla V100 GPU ، عرض النطاق الترددي الكلي لـ NVLink يصل إلى 200 جيجابايت/ثانية للاتصال بين GPU ، واستخدمت ذاكرة HBM2 مع عرض النطاق الترددي الذروة 900 جيجابايت/ثانية للهندسة الفولتا [9] [10]. ومع ذلك ، من المتوقع أن توفر محطة DGX الأحدث مع SuperChip GB300 أداءً محسّنًا بشكل كبير بسبب بنيةها المتقدمة وسعة الذاكرة الأكبر.
توفر أنظمة حوسبة الذكاء الاصطناعية الأخرى ، مثل تلك التي تستخدم ذاكرة Micron DDR5 ، أقصى عرض للنطاق الترددي للذاكرة يصل إلى 614 جيجابايت/ثانية ، وهو مفيد لأعباء عمل الاستدلال الذكاء [2]. يتميز DGX Spark ، وهو نظام حوسبة AI الأصغر من NVIDIA ، بعرض النطاق الترددي للذاكرة يبلغ 273 جيجابايت/ثانية ، وهو أكثر تكلفة وملاءمة لنماذج الذكاء الاصطناعى الأصغر [1] [4].
بالنسبة لتطبيقات الذكاء الاصطناعي الراقية ، توفر أنظمة مثل GPU NVIDIA H100 عروض النطاق الترددي للذاكرة تصل إلى 3 تيرابايت/ثانية مع ذاكرة HBM3 ، متجاوزة بشكل كبير عرض النطاق الترددي لمعظم الأنظمة الأخرى [5]. يتم وضع أداء محطة DGX بين هذه الأطراف المتطرفة ، مما يوفر توازنًا بين سعة الذاكرة العالية وتكنولوجيا التوصيل المتقدمة ، مما يجعله مناسبًا للمطالبة بأعباء عمل الذكاء الاصطناعى دون الوصول إلى النطاق الترددي المتطرف في الحلول التي تركز على مركز البيانات مثل H100.
بشكل عام ، من المتوقع أن تكون عرض النطاق الترددي لمحطة DGX ، على الرغم من عدم ذكره بشكل صريح ، كبيرًا بسبب بنيةها المتقدمة وقدرة الذاكرة الكبيرة ، حيث وضعت أنها أداة قوية لتطوير الذكاء الاصطناعي التي تسد الفجوة بين حلول مركز البيانات الراقية وأنظمة سطح المكتب التي يمكن الوصول إليها.
الاستشهادات:
[1]
[2] https://www.micron.com/content/dam/micron/global/public/documents/products/technical-marketing-brief/ddr5-ii-
[3] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_publish.pdf
[4] https://www.youtube.com/watch؟v=KRBH0VON-2A
[5] https://www.linkedin.com/pulse/martini-straw-analogy-unraveling-memory-bandwidth-bottlenecks-jha-jlprc
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7 "
[8]
[9] https://images.nvidia.com/content/newsletters/email/pdf/dgx-station-wp.pdf
[10] https://xenon.com.au/product/nvidia-dgx-station/