Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon في أي سيناريوهات تتفوق Deepseek على chatgpt في التعلم الصفري


في أي سيناريوهات تتفوق Deepseek على chatgpt في التعلم الصفري


Deepseek يوضح الأداء المتفوق على ChatGPT في سيناريوهات التعلم الصفرية في ظل ظروف محددة. فيما يلي المجالات الرئيسية التي يتفوق فيها Deepseek:

قدرات التفكير المعززة

أظهرت نماذج Deepseek ، وخاصة Deepseek R-1 و R-1-Zero ، تحسينات كبيرة في مهام التفكير مقارنة بـ ChatGPT. في معايير مثل AIME و GPQA ، تفوقت Deepseek R-1-Zero على نموذج O1 Openai ، حيث حققوا تمريرة@1 دقة 71.0 ٪ ، والتي يمكن تعزيزها إلى 86.7 ٪ مع تقنيات التصويت الأغلبية [1] [2]. يشير هذا إلى أن Deepseek بارع بشكل خاص في المهام التي تتطلب التفكير المنطقي دون أمثلة مسبقة.

معالجة المعرفة الخاصة بالمجال

تشمل بنية Deepseek وحدات متخصصة لمختلف المجالات ، مثل الرياضيات والترميز. تسمح هذه الوحدات النمطية بأداء أداء أفضل في السياقات التقنية مقارنة بـ ChatGPT ، والتي تكون أكثر تعميماً. في اختبارات محددة ، تفوقت Deepseek V3 على الدردشة في سيناريوهات التعلم الصفرية ، وخاصة في مهام التفكير والبرمجة الرياضية [3] [4].

الحساسية لتقنيات المطالبة

وقد لوحظ أن نماذج Deepseek تعمل بشكل أفضل من خلال التحطيم صفريًا بدلاً من التحطيم. يتناقض هذا مع chatgpt ، حيث يمكن للسياقات القليلة أن تعزز الأداء. تتمثل التوصية الخاصة بـ DeepSeek في استخدام تعليمات واضحة وموجزة في إعداد صفري للنتائج المثلى ، والتي تتماشى مع النتائج التي توصلت إليها أبحاث Microsoft حول نماذج التفكير [1] [2].

التعلم والتكيف

تتيح عملية التدريب Deepseek R-1-Zero تطوير سلوكيات التفكير المتطورة بشكل مستقل. بمرور الوقت ، تتعلم تصحيح الذات والتحقق من صحة مخرجاتها الخاصة ، مما يؤدي إلى تحسين الدقة في مهام التفكير المعقدة [1]. تعتبر إمكانية تحسين الذات هذه ميزة ملحوظة في سيناريوهات الصفر حيث يجب أن يولد النموذج استجابات دون سياق سابق واسع النطاق.

باختصار ، يتفوق Deepseek على chatgpt في التعلم صفريًا في المقام الأول بسبب قدراتها المعززة للتفكير ، ومعالجة المعرفة المتخصصة للمجال ، وتقنيات الحطام الفعالة ، وآليات التعلم الذاتي القوية. هذه العوامل تجعلها مناسبة بشكل خاص للمهام التي تتطلب الاتساق المنطقي والدقة التقنية.

الاستشهادات:
[1] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-t-ranks-against-openais-o1
[2] https://promthub.substack.com/p/have-the-chinese-overtaken-openai
[3] https://frontend-snippets.com/blog/deepseek-vs-chatgpt-hich-large-language-model-leads-ai
[4] https://aclanthology.org/2024.emnlp-main.408.pdf
[5] https://www.youtube.com/watch؟v=7HCCF8NM8NM
[6] https://news.ycombinator.com/item؟id=42823568
[7]
[8] https://arxiv.org/html/2405.04434v4