DeepSeek R1, lai arī uzlabots spriešanas spēju modelis, uzrāda vairākus ierobežojumus tās daudzuzdevumu spējas. Šeit ir identificētie galvenie ierobežojumi:
Vispārīgi spēju ierobežojumi
DeepSeek R1 veiktspēja daudzuzdevumu veikšanā nav tik spēcīga kā tā priekšgājējs DeepSeek V3, īpaši sarežģītos uzdevumos, piemēram, funkciju izsaukšanā, mijiedarbības mijiedarbībā un JSON izvadē. Tas norāda, ka, lai arī tas var tikt galā ar dažādiem uzdevumiem, tā efektivitāte samazinās sarežģītākos scenārijos, kuriem nepieciešama ilgstoša spriešana vairākos posmos vai kontekstā [1].valodas sajaukšanas problēmas
Modelis galvenokārt tiek optimizēts angļu un ķīniešu valodā, kas var izraisīt valodu sajaukšanu, apstrādājot vaicājumus citās valodās. Tā rezultātā tiek iegūti rezultāti, kas, iespējams, neatbilst lietotāja cerībām vai vaicājuma paredzētajai valodai, tādējādi sarežģot tā lietojamību plašākai auditorijai [1] [4].jutība pret pamudināšanu
DeepSeek R1 parāda augstu jutīgumu pret pamudinājumu struktūru. Tas darbojas slikti ar dažiem kadru pamudināšanas paņēmieniem, kas bieži pazemina tā izejas kvalitāti. Tā vietā ieteicams izmantot nulles šāvienu ar skaidrām un kodolīgām instrukcijām optimālai veiktspējai. Šī jutība var kavēt tā pielāgojamību dažādos uzdevumos un lietotāju ieejās [2] [8].efektivitātes bažas
Modelis saskaras ar izaicinājumiem, kas saistīti ar efektivitāti pastiprināšanas mācīšanās (RL) procesos, jo īpaši programmatūras inženierijas uzdevumos. Sakarā ar ilgajiem novērtēšanas laikiem, kas saistīti ar RL apmācību, DeepSeek R1 nav ievērojami pārspējis iepriekšējos modeļus šajā jomā. Paredzams, ka turpmākie uzlabojumi risinās šīs efektivitātes problēmas, izmantojot tādas metodes kā noraidīšanas paraugu ņemšana un asinhronie novērtējumi [1] [7].izejas kvalitāte un argumentācijas dziļums
Kaut arī DeepSeek R1 izmanto domu pieejas ķēdi, kas ļauj refleksīvi argumentēt, tas dažreiz var izraisīt skaļruņu un pārblīvētu izvadi. Modelis var cīnīties ar koherences saglabāšanu sarežģīta problēmu risināšanas laikā, kā rezultātā rodas izejas, kas jūtas neparastas vai nekoncentrētas. Šī īpašība var mazināt tās reakciju skaidrību un lietderību [2] [3].Rezumējot, kaut arī DeepSEEK R1 ir nozīmīgs progresu argumentācijas spējām lieliem valodas modeļiem, tā daudzuzdevumu spējas ierobežo jautājumi, kas saistīti ar sarežģītības apstrādi, valodu apstrādi, ātru jutīgumu, efektivitāti īpašās jomās un izejas saskaņotību.
Atsauces:[1] https://arxiv.org/html/2501.12948v1
[2] https://www.qodo.ai/blog/qodo-gen-adds-self-hosted-support-for-depseek-r1/
[3] https://www.reddit.com/r/localllama/comments/1i7fjqm/deepseek_r1_is_unusable_imho/
. -101737978272938.html
[5] https://github.com/deepseek-ai/deepseek-r1/issues/26
[6.]
[7] https://adasci.org/mastering-llms-reasoring-apability-with-depseek-r1/
[8] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[9] https://www.vellum.ai/blog/the-training-of-depseek--and-ways-to-use-it