„Deepseek“ pralenkia ChatGPT mokymosi nuliniame šūvyje: pagrindiniai pranašumai ir įžvalgos

Kokiuose scenarijuose „Deepseek“ pralenkia ChatGP

„Deepseek“ demonstruoja pranašesnius rezultatus, palyginti su „ChatGPt“, esant nulinio šūvio mokymosi scenarijams konkrečiomis sąlygomis. Čia yra pagrindinės sritys, kuriose išsiskiria „Deepseek“:

Patobulintos samprotavimo galimybės

„Deepseeek“ modeliai, ypač „Deepseeek R-1“ ir „R-1-Zero“, parodė reikšmingą samprotavimo užduočių pagerėjimą, palyginti su „ChatGPT“. Tokiuose etalonuose kaip AIME ir GPQA, „Deepseee R-1-Zero“ pralenkė Openai O1 modelį, pasiekdamas 71,0% tikslumą, kuris gali būti dar labiau padidintas iki 86,7%, naudojant daugumos balsavimo metodus [1] [2]. Tai rodo, kad „Deepseek“ yra ypač įgudęs užduočių, reikalaujančių loginių samprotavimų be išankstinių pavyzdžių.

Konkrečios srities žinių tvarkymas

„Deepseek“ architektūra apima specializuotus įvairių sričių modulius, tokius kaip matematika ir kodavimas. Šie moduliai leidžia geriau atlikti techninius kontekstus, palyginti su „ChatGPT“, kuris yra labiau apibendrintas. Konkrečiuose testuose „Deepseek V3“ aplenkė „ChatGPt“ pagal nulinio šūvio mokymosi scenarijus, ypač atliekant matematinius samprotavimus ir programavimo užduotis [3] [4].

jautrumas raginimo technikai

Pastebėta, kad „Deepseeek“ modeliai geriau veikia su nulinio šūvio raginimu, o ne nedaugelis. Tai prieštarauja „ChatGPT“, kai keli kadrų kontekstai gali pagerinti našumą. „Deepseek“ rekomendacija yra naudoti aiškias ir glaustas instrukcijas, susijusias su nulinio šūvio nustatymu, kad būtų galima optimalūs rezultatai, kurie suderina su „Microsoft“ tyrimų apie samprotavimo modelius tyrimus [1] [2].

Mokymasis ir adaptacija

„Deepseek R-1-Zero“ mokymo procesas leidžia autonomiškai ugdyti sudėtingą samprotavimo elgseną. Laikui bėgant jis mokosi savarankiškai taisyti ir patvirtinti savo rezultatus, todėl pagerėja sudėtingų samprotavimo užduočių tikslumas [1]. Ši savęs tobulinimo galimybė yra pastebimas pranašumas esant „Zero-shot“ scenarijams, kai modelis turi generuoti atsakymus be plataus ankstesnio konteksto.

Apibendrinant galima pasakyti, kad „Deepseek“ pralenkia „ChatGPt“ mokymąsi „Zero-Shot“, visų pirma dėl jo sustiprintų samprotavimo galimybių, specializuotų sričių žinių tvarkymo, veiksmingų raginimo metodų ir tvirtų savarankiško mokymosi mechanizmų. Šie veiksniai daro jį ypač tinkamu užduotims, reikalaujančioms loginio nuoseklumo ir techninio tikslumo.

Citatos:
[1] https://www.prompthub.us/blog/deepseek-r-1-model-oveview-and-how-it-ranks-against-openais-o1
[2] https://prompthub.substack.com/p/have-the-chinese-overtaken-openai
[3] https://frontend-snippets.com/blog/deepseek-vs-chatgpt-which-large-language-model-leads-ai
[4] https://aclanthology.org/2024.emnlp-main.408.pdf
[5] https://www.youtube.com/watch?v=7HCCF8NM8NM
[6] https://news.ycombinator.com/item?id=42823568
]
[8] https://arxiv.org/html/2405.04434v4