يتضمن تحسين أداء DeepSeek-R1 على AWS العديد من إعدادات الشبكة والتكوينات. فيما يلي نظرة عامة مفصلة حول كيفية تعزيز أدائها:
1. تكوين مثيل EC2 **
- نوع المثيل: اختيار نوع مثيل مع قوة GPU كافية ، مثل "g4dn.xlarge` ، أمر بالغ الأهمية لتشغيل نماذج Deepseek-R1 بكفاءة. يدعم نوع المثيل برامج تشغيل شبكة NVIDIA ، والتي تعد ضرورية لتسارع GPU [1].- إعدادات الشبكة: استخدم إعدادات VPC الافتراضية وحدد منطقة التوفر حيث يتم نشر مثيل EC2 الخاص بك. هذا يضمن أن يكون مثيلك مرتبطًا جيدًا ويمكن الوصول إليه داخل شبكتك [1].
2. مجموعات الأمان **
- تكوين مجموعة أمان جديدة ذات قواعد واردة محددة:- حركة مرور HTTP: السماح لحركة HTTP من نطاق IP موثوق (على سبيل المثال ، "IP") لتمكين وصول الويب إلى النموذج.
- حركة المرور TCP على المنفذ 3000: السماح لحركة TCP من نطاق VPC CIDR لتسهيل الاتصال مع موازن تحميل التطبيق.
- حركة مرور HTTPS: السماح لحركة HTTPS من نطاق VPC CIDR للاتصال الآمن [1].
3.
-المخطط: قم بإعداد ALB مواجهة للإنترنت لفضح نموذج DeepSeek-R1 الخاص بك لحركة المرور الخارجية.- تحميل نوع عنوان IP Balancer: استخدم IPv4 للبساطة والتوافق.
- إعدادات الشبكة: حدد إعدادات VPC الافتراضية ونفس منطقة التوفر مثل مثيل EC2 الخاص بك.
- مجموعات الأمان: استخدم مجموعة الأمان التي تم إنشاؤها أثناء تكوين EC2 لضمان ضوابط الوصول المتسقة [1].
4. تكوين المجموعة المستهدفة **
- نوع الهدف: حدد "مثيلات" كنوع الهدف.- المنفذ: استخدم المنفذ 3000 لإعادة توجيه حركة المرور إلى مثيل EC2 الذي يدير نموذج DeepSeek-R1.
- اسم المجموعة المستهدفة: اسم المجموعة المستهدفة (على سبيل المثال ، "Deepseek-TG") لتحديد السهولة [1].
5. Amazon Sagemaker لتعزيز الأداء **
-نشر النموذج: فكر في نشر نماذج Deepseek-R1 باستخدام Amazon Sagemaker ، والتي تقدم ميزات مثل التقييم التلقائي وموازنة التحميل المرنة. هذا يمكن أن يحسن الاستجابة وقابلية التوسع [3] [4].- دلو S3 الخاص: تخزين الأوزان في دلو S3 الخاص لتقليل الكمون وتعزيز الأمان عن طريق الحفاظ على بيانات النموذج ضمن حساب AWS الخاص بك [3].
6. أفضل الممارسات التحسين **
- التحسين المذهل: استخدم تقنيات مثل التحسين السريع على الأساس الأمازون لتعزيز إمكانيات التفكير في نماذج DeepSeek-R1 [7].- اختيار المنطقة: اختر منطقة AWS الأقرب إلى المستخدمين لتقليل الكمون وتحسين التكاليف [6].
من خلال تطبيق إعدادات الشبكة والتكوينات هذه ، يمكنك تحسين أداء DeepSeek-R1 على AWS ، وضمان نشر النموذج الفعال والقابل للتطوير والآمن.
الاستشهادات:
[1] https://community.aws/content/2seuhqlpyifswckzmx585jcksgn/deploying-deepseek-r1-14b-on-amazon-ec2؟lang=en
[2] https://northflank.com/blog/self-host-deepseek-r1-on-aws-gcp-azure-and-k8s-in-tree-easy-steps
[3] https://aws.amazon.com/blogs/machine-learning/optimize-hosting-deepseek-r1-distilled-models-with-hugging-face-tgi-on-amazon-sagemaker-ai//
[4] https://aws.amazon.com/blogs/machine-learning/deploy-deepseek-distilled-models-on-amazon-sagemaker-use-a-large-model-inference-container/
[5] https://repost.aws/questions/quzc1_jmmesbmpauozqh5jca/guidance-on-aws-deepeek-ai-pring-and-deployment-options
[6]
[7]
[8]