Deepseek يوضح الأداء المتفوق على ChatGPT في سيناريوهات التعلم الصفرية في ظل ظروف محددة. فيما يلي المجالات الرئيسية التي يتفوق فيها Deepseek:
قدرات التفكير المعززة
أظهرت نماذج Deepseek ، وخاصة Deepseek R-1 و R-1-Zero ، تحسينات كبيرة في مهام التفكير مقارنة بـ ChatGPT. في معايير مثل AIME و GPQA ، تفوقت Deepseek R-1-Zero على نموذج O1 Openai ، حيث حققوا تمريرة@1 دقة 71.0 ٪ ، والتي يمكن تعزيزها إلى 86.7 ٪ مع تقنيات التصويت الأغلبية [1] [2]. يشير هذا إلى أن Deepseek بارع بشكل خاص في المهام التي تتطلب التفكير المنطقي دون أمثلة مسبقة.معالجة المعرفة الخاصة بالمجال
تشمل بنية Deepseek وحدات متخصصة لمختلف المجالات ، مثل الرياضيات والترميز. تسمح هذه الوحدات النمطية بأداء أداء أفضل في السياقات التقنية مقارنة بـ ChatGPT ، والتي تكون أكثر تعميماً. في اختبارات محددة ، تفوقت Deepseek V3 على الدردشة في سيناريوهات التعلم الصفرية ، وخاصة في مهام التفكير والبرمجة الرياضية [3] [4].الحساسية لتقنيات المطالبة
وقد لوحظ أن نماذج Deepseek تعمل بشكل أفضل من خلال التحطيم صفريًا بدلاً من التحطيم. يتناقض هذا مع chatgpt ، حيث يمكن للسياقات القليلة أن تعزز الأداء. تتمثل التوصية الخاصة بـ DeepSeek في استخدام تعليمات واضحة وموجزة في إعداد صفري للنتائج المثلى ، والتي تتماشى مع النتائج التي توصلت إليها أبحاث Microsoft حول نماذج التفكير [1] [2].التعلم والتكيف
تتيح عملية التدريب Deepseek R-1-Zero تطوير سلوكيات التفكير المتطورة بشكل مستقل. بمرور الوقت ، تتعلم تصحيح الذات والتحقق من صحة مخرجاتها الخاصة ، مما يؤدي إلى تحسين الدقة في مهام التفكير المعقدة [1]. تعتبر إمكانية تحسين الذات هذه ميزة ملحوظة في سيناريوهات الصفر حيث يجب أن يولد النموذج استجابات دون سياق سابق واسع النطاق.باختصار ، يتفوق Deepseek على chatgpt في التعلم صفريًا في المقام الأول بسبب قدراتها المعززة للتفكير ، ومعالجة المعرفة المتخصصة للمجال ، وتقنيات الحطام الفعالة ، وآليات التعلم الذاتي القوية. هذه العوامل تجعلها مناسبة بشكل خاص للمهام التي تتطلب الاتساق المنطقي والدقة التقنية.
الاستشهادات:[1] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-t-ranks-against-openais-o1
[2] https://promthub.substack.com/p/have-the-chinese-overtaken-openai
[3] https://frontend-snippets.com/blog/deepseek-vs-chatgpt-hich-large-language-model-leads-ai
[4] https://aclanthology.org/2024.emnlp-main.408.pdf
[5] https://www.youtube.com/watch؟v=7HCCF8NM8NM
[6] https://news.ycombinator.com/item؟id=42823568
[7]
[8] https://arxiv.org/html/2405.04434v4