Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon كيف يحافظ Deepseek R1 على السياق على محادثات طويلة توظف | ## الميزات المعمارية ** مزيج من هندسة الخبراء (MOE) تستخدم Deepseek R1 مزيجًا من بنية الخبراء ، مما يسمح لها بتنشيط مجموعة فرعية فقط من 671 مليار من المعلمات خلال كل تمريرة أمامية ، على وج



كيف يحافظ Deepseek R1 على السياق على محادثات طويلة
توظف |

الميزات المعمارية

** مزيج من هندسة الخبراء (MOE)
تستخدم Deepseek R1 مزيجًا من بنية الخبراء ، مما يسمح لها بتنشيط مجموعة فرعية فقط من 671 مليار من المعلمات خلال كل تمريرة أمامية ، على وج

Deepseek R1 ، مزيج من الخبراء ، التعلم التعزيز ، إدارة السياق ، المحادثات الطويلة ، الذكاء الاصطناعي ، بنية النموذج المتقدم ، منهجيات تدريب الذكاء الاصطناعي ، الكفاءة الحسابية ، إمكانات التفكير