يعد Deepseek-R1 و Cohere's Command R (أغسطس 2024) نماذج لغة متقدمة ، لكنها تظهر اختلافات واضحة في الأداء والهندسة المعمارية والتسعير.
العمارة والتدريب:
-Deepseek-R1 هو نموذج 671 مليار من الخبراء (MOE) المعلمة (MOE) ، مع 37 مليار معلمة نشطة لكل رمز. تم تدريبه باستخدام التعلم التعزيز على نطاق واسع ، مع التركيز على قدرات التفكير. يشتمل هذا النموذج على مرحلتين من التعلم التعزيز ومرحلتين من الضبط الخاضع للإشراف لتعزيز قدرات التفكير والقدرات غير المعروفة [1] [3].
- Command R (Aug 2024) ، التي تم تطويرها بواسطة Cohere ، تتميز بتوليد تعدد اللغات المحسّن (RAG) وقدرات استخدام الأدوات. إنه يتفوق في مهام الرياضيات والرمز والمنطق ، مما يوفر نتائج مماثلة لسلفها ، الأمر R+[1] [3].
معايير الأداء:
- يؤدي Deepseek-R1 بشكل مماثل لنموذج Openai O1 عبر العديد من معايير التفكير ، بما في ذلك مهام الرياضيات والرمز. إنه يتفوق في مهام الإبداع والسياق الطويل مثل Alpacaeval 2.0 و Arenahard ، يتفوق على نماذج أخرى في هذه المناطق [2]. سجل Deepseek-R1 90.8 ٪ على معيار MMLU و 84 ٪ على MMLU-PRO ، مما يدل على قدرات التفكير القوية [1].
- يحقق Command R (Aug 2024) درجة 67 ٪ على معيار MMLU و 70 ٪ على Humaneval ، مما يشير إلى أداء قوي في توليد الكود وحل المشكلات [1]. ومع ذلك ، لم يتم الإبلاغ عن أدائها على MMLU-PRO وغيرها من معايير التفكير المحددة.
التسعير والتكلفة:
- DeepSeek-R1 أغلى بكثير من Command R (Aug 2024) ، مع تكاليف الإدخال عند 0.55 دولار لكل مليون رمز وتكاليف الإخراج عند 2.19 دولار لكل مليون رمز. هذا يجعل الأمر أكثر تكلفة بنسبة 3.7 مرات لكل من الرموز المميزة للمدخلات والمخرجات [1] [3].
- يوفر Command R (Aug 2024) تكاليف أقل ، حيث بسعر مميزات مدخلات بسعر 0.15 دولار لكل مليون ورموز إخراج عند 0.60 دولار لكل مليون [1] [4].
مفتوح المصدر والمجتمع:
-Deepseek-R1 مفتوح المصدر ، مما يسمح بتحسينات وتعديلات تعتمد على المجتمع. يمكن أن يؤدي هذا الانفتاح إلى إمكانيات تطوير وتخصيص أكثر شفافية [1] [5].
- Command R (Aug 2024) ليس مفتوح المصدر ، مما يحد من مشاركة المجتمع في تطويره وتخصيصه [1].
حساسية سريعة:
-Deepseek-R1 حساس للمطالبات ، مع وجود القليل من اللقطات التي تدفع في كثير من الأحيان أدائها. يوصى باستخدام صفر طلقة مع تعليمات واضحة للنتائج المثلى [2].
- لا يوجد ذكر محدد للحساسية السريعة للأمر R (أغسطس 2024) في المعلومات المتاحة.
باختصار ، في حين أن كلا النموذجين لديهما قدرات منطقية قوية ، فإن Deepseek-R1 يتفوق في معايير معينة ويوفر مرونة مفتوحة المصدر ، ولكن بتكلفة أعلى. يعد الأمر R (أغسطس 2024) أكثر فعالية من حيث التكلفة ويوفر أداءًا تنافسيًا في مجالات محددة مثل توليد الكود.
الاستشهادات:
[1] https://docsbot.ai/models/compare/Command-R-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-t-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepeek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/Command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/Command-R-03-2024
[8] https://explodingtopics.com/blog/list-of-llms