يتطلب نشر DeepSeek-R1 على AWS موارد كبيرة من GPU بسبب حجمها الكبير والمتطلبات الحسابية. فيما يلي متطلبات واعتبارات GPU المحددة لنشر نماذج DeepSeek-R1 على AWS:
1. حجم النموذج ومتطلبات VRAM: يحتوي نموذج Deepseek-R1 الكامل على 671 مليار معلمة ، ويتطلب VRAM كبيرة. لدعم FP8 الأصلي ، يبلغ متطلبات VRAM حوالي 700 جيجابايت. ومع ذلك ، إذا تم تحويل النموذج إلى BF16 (الذي يدعمه وحدات معالجة الرسومات مثل NVIDIA A100) ، فإن متطلبات VRAM تزداد إلى حوالي 1.4 تيرابايت بسبب تنسيق الدقة العليا [2] [4].
2. تكوين GPU الموصى به: لنموذج Deepseek-R1 الكامل ، من الضروري إعداد GPU متعدد GPU. حالات AWS مثل "P4d.24xlarge` أو" P5.24xlarge "، والتي تم تجهيزها مع وحدات معالجة الرسومات NVIDIA A100 ، مناسبة. توفر هذه الحالات VRAM الضرورية وحساب الطاقة للنماذج واسعة النطاق. لحساب BF16 ، يوصى بإعداد مع 16 NVIDIA A100 وحدات معالجة الرسومات (كل منها 80 جيجابايت من VRAM) [1] [2].
3. خيارات مثيل AWS: تقدم AWS العديد من الحالات التي يمكن أن تدعم نشر نماذج Deepseek-R1 ، بما في ذلك "P4d.24xlarge` و P5.24xlarge`. توفر هذه الحالات إمكانات حوسبة عالية الأداء مع وحدات معالجة الرسومات NVIDIA A100 ، والتي تعد مثالية لنماذج الذكاء الاصطناعى على نطاق واسع مثل Deepseek-R1 [7].
4. القياس الكمي والحوسبة الموزعة: لتقليل متطلبات VRAM وتحسين الكفاءة ، يمكن تطبيق تقنيات القياس. على سبيل المثال ، يمكن أن يؤدي استخدام كمية 4 بت إلى تقليل احتياجات VRAM بشكل كبير ، مما يسمح بالنشر على عدد أقل من وحدات معالجة الرسومات. بالإضافة إلى ذلك ، يمكن استخدام أطر الحوسبة الموزعة لنشر عبء العمل عبر مثيلات متعددة ، مما يعزز قابلية التوسع والأداء [4].
5. حساب ومتطلبات الذاكرة: ما وراء متطلبات GPU ، فإن نشر DeepSeek-R1 يستلزم أيضًا ذاكرة وحدة المعالجة المركزية الكافية وموارد النظام الشاملة. يمكن أن تدعم مثيلات AWS مع ذاكرة وحدة المعالجة المركزية الواسعة ، مثل g6e.4xlarge` الاحتياجات الحسابية الإضافية لهذه النماذج [6].
باختصار ، يتطلب نشر Deepseek-R1 على AWS إعداد GPU قوي ، ويفضل أن يكون مع وحدات معالجة الرسومات NVIDIA A100 ، وربما الاستفادة من الكميات والحوسبة الموزعة لتحسين استخدام الموارد.
الاستشهادات:
[1] https://dev.to/askyt/deepseek-r1-671b-complete-hardware-requirements-optimal-deployment-setup-2e48
[2] https://www.theriseunion.com/en/blog/deepeek-v3-r1-671b-gpu-requirements.html
[3] https://www.byteplus.com/en/topic/385683
[4] https://apxml.com/posts/gpu-requirements-deepseek-r1
[5] https://www.youtube.com/watch؟v=5RHPZGDogle
[6] https://community.databricks.com/t5/machine-learning/undersing-compute-requirements-for-deploying-deepseek-r1/td-p/109187
[7]
[8]