Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon كيف يعزز اتصال NVLink-C2C النطاق الترددي للذاكرة في محطة DGX


كيف يعزز اتصال NVLink-C2C النطاق الترددي للذاكرة في محطة DGX


NVLINK-C2C هي تقنية متصلة عالية السرعة التي طورتها NVIDIA ، والتي ظهرت في المقام الأول في بنية Supercheip Grace Hopper. على الرغم من أن محطة DGX لا تستخدم على وجه التحديد NVLink-C2C ، فإن فهم كيفية تعزيز NVLink-C2C يمكن أن يوفر عرض النطاق الترددي للذاكرة نظرة ثاقبة على الفوائد المحتملة للأنظمة المماثلة.

ميزات مفتاح NVLINK-C2C

1. عرض النطاق الترددي العالي: يوفر NVLink-C2C عرض نطاق ترددي ثنائي الاتجاه يصل إلى 900 جيجابايت/ثانية ، متجاوزة بشكل كبير اتصالات PCIe التقليدية. على سبيل المثال ، يوفر رابط PCIE Gen5 X16 عرض نطاق ترددي أقصى يبلغ حوالي 128 جيجابايت/ثانية في كل اتجاه [2] [7]. يتيح هذا النطاق الترددي العالي نقل البيانات بشكل أسرع بين وحدة المعالجة المركزية و GPU ، وهو أمر بالغ الأهمية للتطبيقات التي تتطلب مجموعات بيانات كبيرة.

2. تجمع الذاكرة الموحد: NVLINK-C2C ينشئ مجموعة ذاكرة موحدة من خلال الجمع بين GPU HBM و CPU DRAM. يتيح هذا ل GPU الوصول إلى ذاكرة وحدة المعالجة المركزية كما لو كانت ذاكرة النطاق الترددي العالي المحلي ، مما يوسع بشكل فعال مساحة الذاكرة المتاحة للطرز الكبيرة أو مجموعات البيانات [4] [7]. هذه الميزة مفيدة بشكل خاص لتطبيقات AI و HPC التي تتجاوز غالبًا حدود ذاكرة GPU.

3. تماسك الذاكرة: يدعم NVLink-C2C تماسك ذاكرة الأجهزة ، مما يضمن تناسق البيانات عبر مساحات ذاكرة وحدة المعالجة المركزية و GPU. هذا يبسط نماذج البرمجة من خلال القضاء على الحاجة إلى إدارة الذاكرة الصريحة ، مما يسمح للمطورين بالتركيز على الخوارزميات بدلاً من معالجة الذاكرة [1] [6].

4. زمن انتقال منخفض: الاتصال المباشر ، على الحزمة بين وحدة المعالجة المركزية و GPU عبر NVLink-C2C يقلل بشكل كبير من تأخير الاتصالات. يتم تقليل الكمون إلى أقل من 20 نانو ثانية ، مقارنة بحوالي 400-600 نانو ثانية لاتصالات PCIe Gen5 [4]. يعزز هذا التخفيض في الكمون كفاءة التطبيقات التي تتطلب اتصالًا متكررًا في وحدة المعالجة المركزية-GPU.

التأثير المحتمل على محطة DGX

على الرغم من أن محطة DGX لا تستخدم NVLink-C2C ، فإن دمج هذه التكنولوجيا يمكن أن يعزز أداءها بشكل كبير. تستخدم محطة DGX حاليًا اتصالات NVLink بين وحدات معالجة الرسومات ، والتي توفر عرض نطاق ترددي أعلى من PCIe ولكنها ليست متقدمة مثل NVLink-C2C. يمكن دمج NVLink-C2C:

-زيادة عرض النطاق الترددي للذاكرة: من خلال توفير تجمع ذاكرة موحد والوصول العالي من النطاق الترددي ، يمكن لـ NVLink-C2C تحسين قدرة محطة DGX على التعامل مع مجموعات البيانات الكبيرة ونماذج AI المعقدة.
-تقليل الكمون: من شأن انخفاض الكمون تحسين كفاءة التطبيقات التي تتطلب تنسيق وحدة المعالجة المركزية الضيقة ، مثل معالجة البيانات في الوقت الحقيقي واستنتاج الذكاء الاصطناعي.
-تعزيز قابلية التوسع: يمكن أن تمكن قدرة NVLink-C2C على دعم الوصول إلى الذاكرة على نطاق واسع من محطة DGX من التوسع بشكل أكثر كفاءة عبر وحدات معالجة الرسومات ووحدات المعالجة المركزية المتعددة ، مما يعود بالنفع على بيئات الحوسبة الموزعة.

باختصار ، على الرغم من أن NVLink-C2C ليس حاليًا جزءًا من محطة DGX ، إلا أن ميزاتها يمكن أن تعزز عرض النطاق الترددي للذاكرة ، وتقلل زمن الوصول ، وتحسين قابلية التوسع إذا تم دمجها في الأنظمة المستقبلية.

الاستشهادات:
[1]
[2] https://videocodec.tistory.com/2935
[3] https://images.nvidia.com/content/newsletters/email/pdf/dgx-station-wp.pdf
[4] https://www.supercluster.blog/p/nvidia-gpu-architecture-and-volution
[5] https://www.linkedin.com/posts/basavaraj-hakari-69b90513_new-cpu-and-nterconnect-nvlink-c2c-faster-activity-71944816145142176-ucrf
[6]
[7] https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
[8] https://www.fibermall.com/blog/nvidia-nvlink.htm
[9]