مقارنة بين GB10 و GB300 Superchips في DGX Spark ومحطة DGX للحوسبة الذكاء الاصطناعي

تعرض بنية وحدة المعالجة المركزية لـ GB10 SuperCHIP في Spark DGX و GB300 SuperCHIP في محطة DGX اختلافات كبيرة مصممة لتطبيقات كل منهما في الحوسبة الذكاء الاصطناعي.

GB10 Supercheip في DGX Spark

تم تصميم SuperChip GB10 في المقام الأول لبيئات سطح المكتب المدمجة عالية الأداء. يميز:

-الهندسة المعمارية: تم بناء GB10 على بنية ARMV9 ويتضمن تكوين معالج ذي 20 نواة ، ويتضمن عشرة نوى قشرة Cortex-X925 وعشرة نوى Cortex-A725. يؤكد هذا التصميم على توازن بين الأداء العالي وكفاءة الطاقة ، مما يجعله مناسبًا لاستخدام سطح المكتب.

-الأداء: توفر GB10 عملية تصل إلى 1000 تريليون عملية في الثانية (TOPS) مع GPU Blackwell المدمجة ، والتي تشمل النوى الموتر من الجيل الخامس ونوى RT من الجيل الرابع. هذه القدرة مفيدة بشكل خاص لاستدلال الذكاء الاصطناعى ومهام الضبط.

-الذاكرة والتوصيل: تستخدم تقنية NVLINK-C2C المترابطة في NVIDIA ، مما يوفر نموذج ذاكرة CPU+GPU-CORERENT مع عرض النطاق الترددي خمسة أضعاف PCIE 5.0. يدعم النظام 128 جيجابايت من ذاكرة LPDDR5x ، مما يتيح التعامل الفعال لأعباء العمل المكثفة للذاكرة.

- حالة الاستخدام الهدف: تم تحسين شرارة DGX ، التي تعمل بواسطة GB10 ، للمطورين الفرديين والباحثين الذين يحتاجون إلى حل قوي ولكنه مضغوط لتطوير نموذج الذكاء الاصطناعي واختباره.

GB300 Superchep في محطة DGX

في المقابل ، تم تصميم SuperChip GB300 للتطبيقات الأكثر شمولاً على مستوى البيانات:

- الهندسة المعمارية: يجمع GB300 أيضًا بين وحدة المعالجة المركزية Grace و GPU Blackwell Ultra ولكن تم تحسينها للعمليات على نطاق واسع. في حين أن التكوينات الأساسية المحددة غير مفصلة ، من المتوقع أن تستفيد من المبادئ المعمارية المماثلة مثل GB10 ولكن مع تحسينات لارتفاع الإنتاجية والكفاءة.

- الأداء: يمكن لـ GB300 تحقيق ما يصل إلى 20 Petaflops من أداء الذكاء الاصطناعي ، متجاوزة بشكل كبير قدرات GB10. هذا يجعلها مناسبة للتدريب على نطاق واسع واستدلال أعباء العمل التي تتطلب قوة حسابية كبيرة.

- الذاكرة والتوصيل: يتميز النظام بذاكرة متماسكة 784 جيجابايت ، ودمج LPDDR5x من وحدة المعالجة المركزية و HBM3E من وحدة معالجة الرسومات. هذه السعة الواسعة للذاكرة تسهل التعامل مع مجموعات البيانات الكبيرة والنماذج المعقدة بشكل أكثر كفاءة. تظل تقنية التوصيل البيني NVLink-C2C ، مما يضمن الاتصال عالي السرعة بين مكونات وحدة المعالجة المركزية ومكونات GPU.

- حالة الاستخدام المستهدف: تهدف محطة DGX إلى المنظمات التي تحتاج إلى إمكانات قوية للحوسبة من الذكاء الاصطناعي لتدريب النماذج النطاق والنشر ، مما يجعلها مثالية لفرق من الباحثين وعلماء البيانات ومطوري البرمجيات الذين يعملون في مشاريع الذكاء الاصطناعى على نطاق واسع.

ملخص الاختلافات

باختصار ، على الرغم من أن كلا من Superchips تستخدم البنى المتقدمة في NVIDIA وتقنيات التوصيل البيني ، إلا أنها تم تحسينها لبيئات مختلفة: يركز GB10 على الأداء المدمج المناسب للمستخدمين الأفراد ، في حين تم تصميم GB300 لتلبية متطلبات العمليات الكبيرة النموذجية في أماكن المؤسسات.

الاستشهادات:
[1] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-tation-personal-ai-copters
[2] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-unveils-dgx-tion-workstation-pcs-gb300-lackwell-ultra-inside
[3]
(4]
[5] https://www.investing.com/news/company-news/nvidia-launches-personal-ai-supercomputers-for-desktops-93ch-3934971
[6] https://www.youtube.com/watch؟v=KRBH0VON-2A
[7]
[8] https://www.theverge.com/news/631957/nvidia-dgx-spark-grace-grace-lackwell-ai-supercomputers-gtc
[9] https://www.theverge.com/2024/2/1/24058186/ai-chips-meta-microsoft-google-nvidia
[10 "
[11] https://www.theverge.com/news/631835/nvidia-lackwell-ultra-ai-chip-gb300
[12] https://www.pcmag.com/news/what-is-nvidias-dgx-tation-a-new-desktop-line-for-ai-work

كيف تختلف بنية وحدة المعالجة المركزية لـ GB10 SuperChip في شرارة DGX عن SuperChip GB300 في محطة DGX

GB10 Supercheip في DGX Spark

GB300 Superchep في محطة DGX

ملخص الاختلافات