Deepseek R1, medtem ko napredni model v zmogljivosti sklepanja kaže več omejitev v svojih večopravilnosti. Tu so opredeljene ključne omejitve:
Splošne omejitve zmogljivosti
Učinkovitost Deepseek R1 v večopravilnosti ni tako robustna kot njegov predhodnik, Deepseek V3, zlasti pri zapletenih nalogah, kot so klice funkcije, interakcije z več obrati in JSON izhod. To kaže, da se kljub temu, da lahko opravlja različne naloge, njegova učinkovitost zmanjšuje v bolj zapletenih scenarijih, ki zahtevajo trajno sklepanje v več korakih ali kontekstih [1].Vprašanja za mešanje jezikov
Model je optimiziran predvsem za angleščino in kitajščino, kar lahko privede do mešanja jezikov pri obdelavi poizvedb v drugih jezikih. To ima za posledico izide, ki se morda ne ujemajo s pričakovanji uporabnika ali predvidenim jezikom poizvedbe in s tem zapletejo njegovo uporabnost za širše občinstvo [1] [4].Občutljivost za spodbujanje
Deepseek R1 kaže visoko občutljivost na strukturo pozivov. Slabo deluje z malo posnetkov, ki spodbujajo tehnike, ki pogosto poslabšajo njegovo proizvodno kakovost. Namesto tega je priporočljivo, da uporabite z ničelnim strelom z jasnimi in jedrnatimi navodili za optimalno delovanje. Ta občutljivost lahko ovira njegovo prilagodljivost pri različnih nalogah in uporabniških vhodih [2] [8].Skrbi za učinkovitost
Model se sooča z izzivi, povezanimi z učinkovitostjo med procesi učenje okrepitve (RL), zlasti pri nalogah programskega inženiringa. Zaradi dolgih časov ocenjevanja, povezanih z usposabljanjem RL, Deepseek R1 ni bistveno presegel prejšnjih modelov v tej domeni. Pričakuje se, da bodo prihodnje izboljšave obravnavale ta vprašanja učinkovitosti z metodami, kot so vzorčenje zavrnitve in asinhrone ocene [1] [7].Izhodi kakovost in globina sklepanja
Medtem ko Deepseek R1 uporablja verigo miselnega pristopa, ki omogoča odsevno sklepanje, to lahko včasih privede do dobesednih in nerednih izhodov. Model se lahko med kompleksnim reševanjem problemov bori z ohranjanjem skladnosti, kar ima za posledico rezultate, ki se počutijo zmotne ali neizpolnjene. Ta značilnost lahko prepreči jasnost in uporabnost njegovih odzivov [2] [3].Če povzamemo, medtem ko Deepseek R1 predstavlja pomemben napredek v zmogljivosti sklepanja za velike jezikovne modele, njegove večopravilnosti omejujejo vprašanja, povezana z ravnanjem z zapletenostjo, obdelavo jezikov, hitro občutljivostjo, učinkovitostjo v določenih področjih in koherenco izhodne izhode.
Navedbe:[1] https://arxiv.org/html/2501.12948V1
[2] https://www.qodo.ai/blog/qdo-gen-adds-self-hosted-support-for-reepseek-r1/
[3] https://www.reddit.com/r/localllama/comments/1i7fjqm/deepseek_r1_is_unusable_imho/
[4] https://www.hindustantimes.com/world-news/us-news/deepseek-ai-chinas-diepseek-r1-low-data-digital-assistant-Impact-wall-seechnology-trgljal-global -101737978272938.html
[5] https://github.com/deepseek-ai/deepseek-r1/isissue/26
[6] https://www.linkedin.com/pulse/deepseek-revolution-ai-open-source-reasoning-20-ramachandran-xakme
[7] https://adasci.org/mastering-llms-reasoning-tabity-with-eepseek-r1/
[8] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-Openais-o1
[9] https://www.vellum.ai/blog/the-training-of-deepseek-r1-and-aws-to-it-it