DeepSeek R1, zatímco pokročilý model ve schopnostech uvažování, vykazuje několik omezení ve svých multitaskingových schopnostech. Zde jsou identifikovaná klíčová omezení:
Omezení obecných schopností
Výkon Deepseek R1 v multitaskingu není tak robustní jako jeho předchůdce, Deepseek V3, zejména ve složitých úkolech, jako jsou volání funkcí, interakce s více otočeními a výstup JSON. To ukazuje, že i když dokáže zvládnout různé úkoly, jeho účinnost se snižuje ve složitějších scénářích, které vyžadují trvalé uvažování napříč několika kroky nebo kontexty [1].Problémy s mícháním jazyků
Model je primárně optimalizován pro angličtinu a čínštinu, což může vést k míchání jazyků při zpracování dotazů v jiných jazycích. To má za následek výstupy, které nemusí odpovídat očekáváním uživatele nebo zamýšleným jazykem dotazu, čímž komplikuje jeho použitelnost pro širší publikum [1] [4].Citlivost na výzvu
Deepseek R1 ukazuje vysokou citlivost na strukturu výzev. Funguje špatně s technikami s několika výhodami, které často degradují jeho kvalitu výstupu. Místo toho se doporučuje použít výzvu k nulovému výstřelu s jasnými a stručnými pokyny pro optimální výkon. Tato citlivost může bránit její přizpůsobivosti napříč různými úkoly a uživatelskými vstupy [2] [8].Efektivita obavy
Model čelí výzvám souvisejícím s efektivitou během procesů zesílení (RL), zejména v úkolech softwarového inženýrství. Vzhledem k dlouhým časům hodnocení spojených s tréninkem RL Deepseek R1 významně nepřekonal předchozí modely v této doméně. Předpokládá se, že budoucí vylepšení bude řešit tyto problémy s účinností prostřednictvím metod, jako je odběr odmítnutí a asynchronní hodnocení [1] [7].Hloubka kvality výstupu a uvažování
Zatímco Deepseek R1 využívá řetězový přístup, který umožňuje reflexní uvažování, může to někdy vést k podávaným a zaplněným výstupům. Model se může potýkat s udržováním koherence během komplexního řešení problémů, což má za následek výstupy, které se cítí nevyzpytatelné nebo rozostřené. Tato charakteristika může snižovat jasnost a užitečnost jeho odpovědí [2] [3].Stručně řečeno, zatímco Deepseek R1 představuje významný pokrok ve schopnostech uvažování pro velké jazykové modely, jeho multitaskingové schopnosti jsou omezeny problémy souvisejícími s manipulací s složitou, zpracováním jazyka, rychlou citlivostí, účinností v konkrétních doménách a výstupní koherencí.
Citace:[1] https://arxiv.org/html/2501.12948v1
[2] https://www.qodo.ai/blog/qodo-gen-adds-Self-Support-for-reepseek-r1/
[3] https://www.reddit.com/r/localllama/comments/1i7fjqm/deepseek_r1_is_unusable_imho/
[4] https://www.hindustantimes.com/world-news/us-news/deepseek-ai-chinass-deepseek-r1-low-data-digital-Assistant-impact-wall--street-technology-market-global -101737978272938.html
[5] https://github.com/deepseek-ai/deepseek-r1/issues/26
[6] https://www.linkedin.com/pulse/deepseek-revolution-ai-open-source-reasonring-20-ramachandran-xakme
[7] https://adasci.org/Mastering-LLMS-Reasoning-Capability-with-deepseek-r1/
[8] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-it-ranks-against-openais-o1
[9] https://www.vellum.ai/blog/the-training-of-deepseek-r1-anday-to-use-it