يتضمن تخصيص نماذج DeepSeek-R1 العديد من مكونات التكلفة ، خاصة عند نشرها على منصات مثل Amazon Web Services (AWS). فيما يلي انهيار مفصل للتكاليف المرتبطة بتخصيص نماذج DeepSeek-R1 ونشرها:
1. تكاليف التدريب: تكلفة التدريب الأولية لـ Deepseek-R1 أقل بكثير مقارنةً بالطرز الأخرى مثل ChatGPT O1. يقدر Deepseek-R1 بتكلفة ما بين 6 ملايين دولار للتدريب ، وهو من 16x إلى 33x أرخص من Chatgpt O1 [3]. ومع ذلك ، فإن هذه التكلفة مخصصة للتطوير الأولي وتدريب النموذج ، وليس للتخصيص.
2. التخصيص والنشر على AWS: عند تخصيص نماذج Deepseek-R1 باستخدام ميزة استيراد النموذج المخصص لـ Amazon Bedrock ، هناك العديد من التكاليف التي يجب مراعاتها:
- تكاليف الاستدلال: تستند هذه إلى عدد نسخ النماذج النشطة ومدة نشاطها. يختلف التسعير لكل وحدة نموذج مخصصة (CMU) اعتمادًا على عوامل مثل الهندسة المعمارية والمنطقة. على سبيل المثال ، يكون سعر CMU في الدقيقة 0.0785 دولار [4].
- تكاليف التخزين: هناك تكلفة تخزين شهرية لكل CMU ، أي 1.95 دولار [4]. يعتمد عدد CMUS المطلوب على بنية النموذج وطول السياق.
3. مثال حساب التكلفة: بالنسبة لنموذج Deepseek-R1-distill-llama-8b الذي يتطلب 2 cmus ، إذا كان النموذج نشطًا لمدة ساعة واحدة في اليوم ، فإن تكلفة الاستدلال اليومية ستكون حوالي 9.42 دولار. على مدار شهر واحد ، فإن هذا الإجمالي إلى 282.60 دولار للاستدلال و 3.90 دولار للتخزين ، مما يؤدي إلى إجمالي التكلفة الشهرية المقدرة البالغة 286.50 دولار [4].
4. التسعير عند الطلب لنماذج Deepseek: على AWS ، فإن التسعير عند الطلب لنماذج Deepseek مثل Deepseek R-1 هو 0.00135 دولار لكل 1000 رمز إدخال و 0.0054 دولار لكل 1000 رموز الإخراج [8]. نموذج التسعير هذا مفيد للتطبيقات التي تتطلب استخدامًا مرنًا دون التزامات طويلة الأجل.
باختصار ، يتضمن تخصيص نماذج DeepSeek-R1 تكاليف تتعلق بنشر النموذج والاستخدام على منصات مثل AWS ، مع رسوم محددة للاستدلال والتخزين على أساس وحدات النماذج المخصصة. تكلفة التدريب الأولية للنموذج أقل بكثير من النماذج المماثلة ، مما يجعلها خيارًا فعالًا من حيث التكلفة لتطبيقات الذكاء الاصطناعي.
الاستشهادات:
[1] https://api-docs.deepeek.com/quick_start/pring
[2] https://www.together.ai/models/deepseek-r1
[3]
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-distilled-llama-models-with-amazon-bedrock-custom-model-emport
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-a-cost-affile-ai-model/post/166557
[6]
[7]
[8] https://aws.amazon.com/bedrock/pring/