تم تصميم NVIDIA GB10 GRACE Blackwell Superchip للتعامل مع مهام التعلم الآلي مع كفاءة استثنائية وقوة. إنه مكون رئيسي في أرقام مشروع NVIDIA ، وهو حاسوب عظمى من الذكاء الاصطناعي الذي يهدف إلى الديمقراطية الوصول إلى الحوسبة عالية الأداء من الذكاء الاصطناعي للباحثين وعلماء البيانات والطلاب.
ميزات المفاتيح للتعلم الآلي
- أداء الذكاء الاصطناعي: يقدم SuperChip GB10 ما يصل إلى 1 Petaflop من أداء الذكاء الاصطناعي في Precision FP4 ، مما يجعله قادرًا على تشغيل نماذج منظمة العفو الدولية الكبيرة مع ما يصل إلى 200 مليار معلمة. يعد هذا المستوى من الأداء أمرًا بالغ الأهمية لمهام التعلم الآلي المعقدة مثل معالجة اللغة الطبيعية ورؤية الكمبيوتر [1] [3] [5].
-الهندسة المعمارية: يعتمد SuperChip على الهندسة المعمارية Nvidia Grace Blackwell ، حيث تجمع بين GPU Nvidia Blackwell مع أحدث النوى Cuda Core و Generation Generation Tensor. هذه المكونات ضرورية لتسريع حسابات التعلم الآلي [1] [5].
-تكامل وحدة المعالجة المركزية و GPU: يتضمن SuperChip GB10 وحدة المعالجة المركزية NVIDIA GRACE عالية الأداء مع 20 نوى موفرة للطاقة مبنية على بنية الذراع. يتم توصيل وحدة المعالجة المركزية هذه إلى GPU عبر ربط رقاقة إلى رقاقة NVLink-C2C ، مما يتيح نقل البيانات عالي السرعة بين وحدة المعالجة المركزية و GPU ، وهو أمر حيوي لتدريب نموذج التعلم الآلي الفعال والاستدلال [1] [7].
- الذاكرة والتخزين: يتميز بـ 128 جيجابايت من ذاكرة موحدة متماسكة وما يصل إلى 4 تيرابايت من تخزين NVME. تتيح سعة الذاكرة وسعة التخزين هذه معالجة مجموعات البيانات الكبيرة والنماذج المعقدة ، والتي تعتبر شائعة في تطبيقات التعلم الآلي [1] [3].
- قابلية التوسع: بالنسبة للمهام الأكثر تطلبًا ، يمكن ربط وحدة رقمين للمشروع معًا باستخدام شبكات NVIDIA ConnectX ، مما يسمح لهما بتشغيل النماذج بما يصل إلى 405 مليار معلمة. إن قابلية التوسع هذه مفيدة لمشاريع التعلم الآلي على نطاق واسع تتطلب الحوسبة الموزعة [1] [3].
تطبيقات التعلم الآلي
SuperChip GB10 مناسب تمامًا لتطبيقات التعلم الآلي المختلفة ، بما في ذلك:
- الذكاء الاصطناعي التوليدي: يمكنه التعامل مع النماذج التوليدية المعقدة المستخدمة في مهام مثل توليد الصور وتوليد النص.
- النمذجة ثلاثية الأبعاد والرسوم المتحركة: يدعم SuperChip المهام التي تتطلب قوة حسابي عالية ، مثل التقديم والمحاكاة في البيئات ثلاثية الأبعاد.
- نماذج لغة كبيرة: مع القدرة على تشغيل نماذج تصل إلى 200 مليار معلمة ، فهي مثالية لمهام معالجة اللغة الطبيعية مثل ترجمة اللغة وتلخيص النص [1] [4].
التطوير والنشر
تتيح أرقام المشروع للمستخدمين تطوير وتشغيل الاستدلال على النماذج باستخدام نظام سطح المكتب الخاص بهم ثم نشرها بسلاسة على البنية التحتية السحابية أو مركز البيانات المتسارع. يتم دعم سير العمل من طرف إلى طرف من خلال منصة برنامج AI Enterprise من NVIDIA ، والتي تتضمن أدوات مثل Pytorch و Jupyter Notebooks لتطوير النماذج ونشرها [1] [7].
بشكل عام ، تم تصميم SuperChip GB10 لتمكين المطورين من النماذج الأولية ، ونشر نماذج الذكاء الاصطناعى محليًا قبل توسيع نطاقها على البنية التحتية السحابية أو مركز البيانات ، مما يجعلها أداة قوية لمهام التعلم الآلي.
الاستشهادات:
[1] https://quantumzeitgeist.com/nvidia-onvils-smallest-ai-supercomputer-for-developers-every/
[2] https://news.ycombinator.com/item؟id=42619139
[3] https://akihabaranews.com/nvidias-new-gb10-superchip/
[4] https://www.hp.com/us-en/workstations/workstation-pcs.html
[5] https://www.elektormagazine.com/news/project-digits-nvidia-onvils-personal-ai-supercomputer
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7]
[8] https://www.guru3d.com/news/page-2017/
[9] https://meta-quantum.today/؟p=3460
[10] https://www.hyperstack.cloud/blog/thought-leadership/nvidia-project-digits-all-you-need-thend-about-lackwell-ai-supercomputer
[11] https://www.nvidia.com/en-us/project-digits/