NVIDIA GB10 GRACE Blackwell SuperCHIP هو نظام قوي على الرقاقة (SOC) مصمم للتعامل مع كل من تدريب نماذج الذكاء الاصطناعى واستدلالها بكفاءة. إنه أمر أساسي لأنظمة مثل NVIDIA Project Project و ASUS ASCENT GX10 AI SuperComputer ، والتي تهدف إلى إلغاء الديمقراطية الوصول إلى الحوسبة عالية الأداء AI.
مكونات المفاتيح والهندسة المعمارية
- GPU و Tensor Cores: يتميز SuperChip GB10 بوحدة معالجة الرسومات NVIDIA Blackwell مع النوى الموترات من الجيل الخامس. يتم تحسين هذه النوى الموترات لمضاعفات المصفوفة ، والتي تعد حاسمة لمهام التعلم العميق. إنها تعزز بشكل كبير أداء عمليات التدريب والاستدلال من خلال توفير معالجة عالية السرعة لحسابات الذكاء الاصطناعى المعقدة.
-وحدة المعالجة المركزية: يتضمن SuperChip وحدة المعالجة المركزية ذات الأداء العالي ذات الأداء العالي ، والتي تتكون من 10 نوى CPU CORTEX X925 و 10 A725 وحدة المعالجة المركزية. يعزز وحدة المعالجة المركزية هذه المعالجة المسبقة للبيانات وتنسيقها ، وتسريع ضبط النماذج والاستدلال في الوقت الفعلي. تساهم بنية ARM في إدارة الطاقة والأداء الفعالة ، مما يجعلها مناسبة لتطبيقات AI EDGE.
- الذاكرة والتوصيل: يوفر SuperChip GB10 128 جيجابايت من الذاكرة المتماسكة الموحدة ، وهو أمر ضروري للتعامل مع نماذج الذكاء الاصطناعى الكبيرة. يستخدم NVIDIA NVLINK-C2C ، مما يوفر نموذج ذاكرة وحدة المعالجة المركزية+وحدة المعالجة المركزية متماسكة مع عرض نطاق ترددي أعلى بكثير من واجهات PCIE التقليدية. تضمن هذه البنية نقل بيانات سلس بين وحدة المعالجة المركزية و GPU ، مما يؤدي إلى تحسين مهام التدريب والاستدلال.
قدرات التدريب والاستدلال
- التدريب: في حين أن SuperChip GB10 لا يتم تصميمه في المقام الأول كرقاقة تدريب مخصصة مثل GPUs Tesla's Tesla's Nvidia ، إلا أنه يمكنه التعامل مع النماذج الأولية وضبط نماذج الذكاء الاصطناعى. تتيح مجموعة GPU ومجموعة وحدة المعالجة المركزية عالية الأداء للمطورين العمل على نماذج أصغر إلى متوسطة الحجم مباشرة على أجهزة سطح المكتب الخاصة بهم. بالنسبة للنماذج الأكبر ، يمكن استخدامه بالاقتران مع الخدمات السحابية لمزيد من مهام التدريب شاملة.
-الاستدلال: يتفوق SuperChip GB10 في مهام الاستدلال ، وتنفيذ النماذج التي تم تدريبها مسبقًا بكفاءة لاتخاذ قرارات في الوقت الفعلي بناءً على بيانات جديدة. يتيح دعمها لدقة FP4 و CORES من الجيل الخامس معالجة سريعة ودقيقة لنماذج الذكاء الاصطناعى ، مما يجعلها مثالية للتطبيقات التي تتطلب استنتاجًا سريعًا ، مثل AI Edge و Robotics وأجهزة إنترنت الأشياء الذكية.
قابلية التوسع والنشر
يسمح كل من أرقام المشروع و ASUS ASCET GX10 بنشر نماذج من الذكاء الاصطناعى من بيئات سطح المكتب المحلية إلى البنية التحتية السحابية أو مركز البيانات باستخدام برنامج NVIDIA AI. هذا يعني أن المطورين يمكنهم النماذج الأولية على النماذج محليًا ومن ثم توسيع نطاقها في السحابة دون تعديلات رمز كبيرة ، مما يسهل عمليات التكرار والنشر الفعالة.
باختصار ، تم تصميم SuperChip GB10 لتمكين مطوري الذكاء الاصطناعي بأداة مدمجة ولكنها قوية لكل من مهام التدريب والاستدلال. على الرغم من أنه أكثر توجهاً نحو الاستدلال والنماذج الأولية ، إلا أنه يمكن تمديد قدراته من خلال التكامل مع الخدمات السحابية لتلبية احتياجات التدريب الأكثر شمولاً.
الاستشهادات:
[1] https://www.hyperstack.cloud/blog/theought-leadership/nvidia-project-digits-all-you-need-to-about-lackwell-ai-supercomputer
[2] https://www.nvidia.com/en-us/project-digits/
[3]
[4] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-lackwell-superchip/
[5] https://www.mediatek.com/press-room/mediatek-collaborates-with-nvidia-on-the-new-nvidia-gb10-grace-lackwell-superchip-powering-the-nvidia-project-personal-ai-supercomputer
[6] https://www.friendsofthemetaverse.com/blog/ai-chips-explained-training-vs-inference-processors- endiled
[7]
[8]
[9] https://meta-quantum.today/؟p=3460
[10] https://newsroom.arm.com/blog/arm-nvidia-project-digits-high-performance-ai