„Deepseek R1“, nors ir pažengęs samprotavimo galimybių modelis, parodo keletą daugialypių galimybių apribojimų. Čia pateikiami pagrindiniai apribojimai:
Bendrieji galimybių apribojimai
„Deepseeek R1“ atlikimas atliekant daugiafunkcinį vykdymą nėra toks tvirtas kaip jo pirmtakas, „Deepseeek V3“, ypač atliekant sudėtingas užduotis, tokias kaip funkcijų skambutis, daugialypės posūkio sąveika ir JSON išvestis. Tai rodo, kad nors ji gali atlikti įvairias užduotis, jo efektyvumas sumažėja sudėtingesniuose scenarijuose, reikalaujančiuose nuolatinio samprotavimo keliuose etapuose ar kontekstuose [1].Kalbos maišymo problemos
Modelis pirmiausia yra optimizuotas anglų ir kinų kalboms, dėl kurių kalbų maišymas gali būti maišomas apdorojant užklausas kitomis kalbomis. Tai lemia išėjimus, kurie gali neatitikti vartotojo lūkesčių ar numatytos užklausos kalbos, taip apsunkindama jo tinkamumą platesnei auditorijai [1] [4].jautrumas raginimui
„Deepseek R1“ rodo didelį jautrumą raginimų struktūrai. Tai blogai veikia su keliais kadruose, kuriuose buvo naudojami būdai, kurie dažnai pablogina jo išvesties kokybę. Vietoj to, norint optimaliai našumui naudoti, rekomenduojama naudoti „Zero-Shot“ raginimą su aiškiomis ir glaustomis instrukcijomis. Šis jautrumas gali kliudyti jo pritaikomumui atliekant skirtingas užduotis ir vartotojo įvestis [2] [8].Efektyvumo problemos
Modelis susiduria su iššūkiais, susijusiais su efektyvumu per stiprinimo mokymosi (RL) procesus, ypač atliekant programinės įrangos inžinerijos užduotis. Dėl ilgo vertinimo laiko, susijusio su RL mokymu, „Deepseek R1“ šioje srityje reikšmingai nepveria ankstesnių modelių. Tikimasi, kad ateityje patobulinimai išspręs šias efektyvumo problemas, tokiais kaip atmetimo atranka ir asinchroniniai vertinimai [1] [7].išėjimo kokybė ir samprotavimo gylis
Nors „Deepseek R1“ naudoja minties grandinę, leidžiančią atspindėti pagrįstumą, tai kartais gali sukelti žodžių ir netvarkingų išėjimų. Modelis gali kovoti su nuoseklumo palaikymu sudėtingo problemų sprendimo metu, todėl gali būti išėjimai, kurie jaučiasi klaidingi ar neuždengę. Ši savybė gali sumenkinti jo atsakymų aiškumą ir naudingumą [2] [3].Apibendrinant galima pasakyti, kad nors „Deepseek R1“ yra reikšminga didelių kalbų modelių samprotavimo galimybių tobulėjimas, jo daugiafunkcinius galimybes riboja problemos, susijusios su sudėtingumo tvarkymu, kalbos apdorojimu, greitu jautrumu, konkrečių sričių efektyvumu ir išvesties nuoseklumu.
Citatos:[1] https://arxiv.org/html/2501.12948v1
[2] https://www.qodo.ai/blog/qodo-gen-adds-self-hosted-spport-for-se-deepseek-r1/
[3] https://www.reddit.com/r/localllama/comments/1i7fjqm/deepseek_r1_is_unusable_imho/
[4] https://www.hindustantimes.com/world-news/us-news/deepseek-ai-chinas-deepseek-r1-Low-Data-Digital-sistant-impact-Wall-Street-Technology-Market-Global -101737978272938.html
[5] https://github.com/deepseek-ai/deepseek-r1/issues/26
[6] https://www.linkedin.com/pulse/deepseek-revolutioning-ai-open-ource-reasoning-20-ramachandran-xakme
[7] https://adaci.org/masterling-llms-reasoning-capability-with-deepseek-r1/
[8] https://www.prompthub.us/blog/deepseek-r-1-model-oveview-and-how-it-ranks-against-openais-o1
[9] https://www.vellum.ai/blog/the-training-of-deepseek-r1-and-ways-to-use-use-it-it