يمثل الجيل الخامس NVLink ، الذي تم تقديمه في عام 2024 ، تقدمًا كبيرًا على أسلافها ، وخاصة من حيث النطاق الترددي وقابلية التوسع. فيما يلي الاختلافات الرئيسية بين NVLink 5.0 والأجيال السابقة:
النطاق الترددي والسرعة
- يوفر NVLINK 5.0 زيادة كبيرة في النطاق الترددي ، مما يوفر 1.8 تيرابايت/ثانية من إجمالي النطاق الترددي ثنائي الاتجاه لكل وحدة معالجة الرسومات. يتم تحقيق ذلك من خلال 18 روابط NVLink ، كل قادر على 50 جيجابايت/ثانية في كل اتجاه ، ويبلغ مجموعه 100 جيجابايت/ثانية لكل رابط ثنائي الاتجاه [1] [4].- NVLINK 4.0 ، الموجود في وحدات معالجة الرسومات هوبر ، يدعم 18 رابطًا أيضًا ولكن بسرعة أقل من 50 جيجابايت/ثانية لكل رابط ، مما يؤدي إلى عرض النطاق الترددي الإجمالي 900 جيجابايت/ثانية [7].
- NVLINK 3.0 ، المستخدمة في وحدات معالجة الرسومات AMPERE مثل A100 ، تدعم ما يصل إلى 12 رابطًا مع عرض النطاق الترددي 50 جيجابايت/ثانية لكل رابط ، مما يحقق ما مجموعه 600 جيجابايت/ثانية [7].
قابلية التوسع والهندسة المعمارية
- تم تصميم NVLink 5.0 للهندسة المعمارية Blackwell ، والتي تم تحسينها لأنظمة GPU متعددة. إنه يتيح التواصل السلس بين مئات وحدات معالجة الرسومات ، مما يجعله مثاليًا للحوسبة exascale ونماذج الذكاء الاصطناعي الكبيرة [1] [4].- لم تقدم الأجيال السابقة ، مع دعم تكوينات GPU المتعددة ، نفس المستوى من قابلية التوسع مثل NVLink 5.0. على سبيل المثال ، تم استخدام NVLink 4.0 في وحدات معالجة الرسومات Hopper ، والتي دعمت أيضًا تكوينات GPU واسعة النطاق ولكن مع نطاق ترددي أقل [7].
التكنولوجيا والتوصيل البيني
- يستخدم NVLink 5.0 إشارات PAM4 المتقدمة PAIR-PAIR ، على غرار NVLINK 4.0 ، ولكن مع ارتفاع معدلات البيانات لكل حارة [7].-تلعب مفاتيح NVLink دورًا حاسمًا في NVLink 5.0 ، مما يتيح التواصل الفعال لجميع الجهد بين وحدات معالجة الرسومات. يوفر Switch NVLink 5 144 منفذًا مع سعة تبديل غير محظورة تبلغ 14.4 تيرابايت/ثانية ، مما يعزز بشكل كبير قابلية التوسع عبر خوادم متعددة [4].
التطبيقات والأداء
- تم تحسين NVLink 5.0 لتطبيقات الحوسبة عالية الأداء ، وخاصة تلك التي تتضمن نماذج كبيرة من الذكاء الاصطناعي والحوسبة exascale. يتيح عرض النطاق الترددي المتزايد تبادل البيانات بشكل أسرع بين وحدات معالجة الرسومات ، وهو أمر بالغ الأهمية لمهام المعقدة ومهام التعلم العميق [1] [4].- ركزت الأجيال السابقة أيضًا على تطبيقات عالية الأداء ولكنها كانت محدودة بسبب انخفاض النطاق الترددي. تم استخدام NVLink 3.0 و 4.0 في البيئات التي تتطلب طاقة حسابية عالية ، مثل AI و HPC ، ولكن مع قدرة أقل على نماذج كبيرة جدًا مقارنةً بـ NVLink 5.0 [2] [7].
بشكل عام ، يمثل NVLink 5.0 قفزة كبيرة إلى الأمام من حيث عرض النطاق الترددي ، وقابلية التوسع ، والأداء ، ووضعه كمكون حاسم للتطورات المستقبلية في الذكاء الاصطناعي والحوسبة عالية الأداء.
الاستشهادات:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/evolution-of-nvlink.htm
[6] https://www.nexgencloud.com/blog/performance-benchmarks/nvidia-lackwell-vs-nvidia-hopper-a-dailed-comparison
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-volution-of-nvlink