تعزيز عرض النطاق الترددي للذاكرة مع تقنية NVLink-C2C في أنظمة شرارة DGX

تلعب تقنية NVLINK-C2C دورًا حاسمًا في تعزيز عرض النطاق الترددي للذاكرة في أنظمة مثل شرارة DGX من خلال توفير التوصيل العالي النطاق الترددي للانخفاض بين وحدة المعالجة المركزية ووحدة المعالجة المركزية. هذه التكنولوجيا مفيدة بشكل خاص في الأنظمة التي تتطلب تواصلًا متكررًا بين هذه المكونات ، مثل أعباء العمل من الذكاء الاصطناعى وأعباء عمل الحوسبة عالية الأداء (HPC).

تحسينات المفاتيح

1. عرض النطاق الترددي العالي: يوفر NVLink-C2C عرضًا أقصى عرض نطاق 900 جيجابايت/ثانية ، وهو أعلى بكثير من اتصالات PCIe التقليدية. على سبيل المثال ، يوفر PCIE Gen4 فقط عرض النطاق الترددي ثنائي الاتجاه 64 جيجابايت/ثانية ، بينما يحقق NVLink-C2C زيادة 14x عن هذا [1]. يتيح هذا النطاق الترددي العالي نقل البيانات السريعة بين وحدة معالجة الرسومات ووحدة المعالجة المركزية ، وهو أمر ضروري لنماذج الذكاء الاصطناعى الكبيرة أو مجموعات البيانات التي تتجاوز قدرة ذاكرة GPU.

2. انخفاض الكمون: يتم تقليل الكمون في NVLink-C2C بشكل كبير مقارنة بالاتصالات القائمة على PCIE. في حين أن GPU H100 باستخدام PCIE Gen5 لديه زمن انتقال يتراوح بين 400-600 نانو ثانية للوصول إلى ذاكرة وحدة المعالجة المركزية إلى GPU ، فإن NVLink-C2C يقلل من هذا إلى أقل من 20 نانو ثانية ، مما يحقق تقليل الكمون حوالي 95-97 ٪ [1]. هذا الكمون المنخفض أمر بالغ الأهمية للمهام التي تتطلب تنسيق وحدة المعالجة المركزية الضيقة ونقل البيانات السريعة.

3. تجمع الذاكرة الموحد: NVLink-C2C يتيح إنشاء تجمع ذاكرة موحدة من خلال السماح ل GPU بالوصول إلى ذاكرة وحدة المعالجة المركزية مباشرة. هذا يعني أن GPU يمكنه استخدام DRAM CPU كما لو كانت ذاكرة محلية عالية النطاق الترددي ، مما يزيل بشكل فعال قيود سعة ذاكرة GPU التقليدية [1] [2]. هذه الميزة مفيدة بشكل خاص لنماذج الذكاء الاصطناعى الكبيرة أو مجموعات البيانات التي تتطلب ذاكرة أكثر مما هو متاح على وحدة معالجة الرسومات.

4. تماسك الذاكرة: يدعم NVLink-C2C تماسك الذاكرة ، مما يضمن أن البيانات متسقة عبر كل من ذاكرة وحدة المعالجة المركزية و GPU. يسمح ذلك بدائل التزامن الفعالة ويقلل من الحاجة إلى إدارة الذاكرة الصريحة من قبل المطورين [2]. يتيح تماسك الذاكرة أيضًا التزامن خفيف الوزن عبر مؤشرات ترابط GPU و CPU ، مما يؤدي إلى تحسين استخدام النظام بشكل عام.

5. قابلية التوسع وكفاءة الطاقة: تدعم NVLink-C2C قابلية التوسع عن طريق تمكين إعدادات GPU متعددة الكفاءة ومصممة لتكون كفاءة في الطاقة ، وذلك باستخدام تقنيات الإشارة المتقدمة لتقليل استهلاك الطاقة [3] [4]. هذا يجعلها مناسبة لبيئات الحوسبة واسعة النطاق حيث يكون كل من الأداء وكفاءة الطاقة أمرًا بالغ الأهمية.

باختصار ، تعمل تقنية NVLink-C2C في أنظمة مثل DGX Spark على تعزيز عرض النطاق الترددي للذاكرة بشكل كبير من خلال توفير اتصال عالي السرعة منخفضة بين GPU و CPU. يتيح ذلك معالجة أكثر كفاءة لمجموعات البيانات الكبيرة وأعباء عمل الذكاء الاصطناعى من خلال إنشاء تجمع ذاكرة موحد وتقليل الحاجة إلى إدارة الذاكرة الصريحة.

الاستشهادات:
[1] https://www.supercluster.blog/p/nvidia-gpu-architecture-and-volution
[2]
[3] https://www.fibermall.com/blog/dgx-gh200.htm
[4]
[5]
[6]
[7] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[8] https://www.naddod.com/blog/the-high-speed-road-of-gpus
[9]
[10] https://www.amax.com/content/files/2023/12/nvidia_grace_cpu_superchip_enhanced_computing_whitepaper.pdf

كيف تعمل تقنية NVLink-C2C على تحسين عرض النطاق الترددي للذاكرة في Spark DGX

تحسينات المفاتيح