„Deepseek Coder“: kodo tikslumo patobulinimas per pažangias mokymus ir atsiliepimus

Kaip „DeepSeee“ koderis užtikrina sugeneruoto kodo tikslumą

„Deepseek Coder“ naudoja keletą strategijų, kad užtikrintų jo generuojamo kodo tikslumą. Šios strategijos grindžiamos jos mokymo metodika, vertinimo metrika ir nuolatiniai patobulinimai, pagrįsti vartotojų atsiliepimais ir našumo etalonais.

Mokymo metodika

„Deepseek Coder“ yra mokomas didžiulio duomenų rinkinio, sudaryto iš 2 trilijonų žetonų, maždaug 87% šių duomenų yra kodas, o likusi 13% natūralios kalbos. Šis platus mokymai leidžia modeliui suprasti įvairių kodavimo projektų kontekstą, leidžiantį jam pateikti tikslesnius kodų pasiūlymus, pritaikytus konkrečioms užduotims [2]. Modelyje mokymo metu naudojamas blankus metodas, o tai padidina jo sugebėjimą generuoti atitinkamus kodo fragmentus, kurie atitinka esamas kodo struktūras [3].

Vertinimo metrika

Norint įvertinti jo našumą, „DeepSeek Coder“ yra lyginamasis pagal įvairias nustatytas kodavimo užduotis. Pažymėtina, kad tai parodė tvirtus rezultatus tokiuose etalonuose kaip „Humaneval“ ir „MBPP“, kurie įvertina modelio sugebėjimą užpildyti žmogaus parašytą kodą ir generuoti atitinkamai funkcinį kodą. Pavyzdžiui, tikslumo pagerėjimas buvo pastebėtas po išankstinio mokymo atnaujintose „Code Corpora“, o po tolesnių mokymų balai padidėjo nuo 30,5% iki 37,2% [6]. Šie etalonai suteikia kiekybinį modelio efektyvumo matuojant generuojant tikslų kodą.

grįžtamojo ryšio mechanizmai

„Deepseek Coder“ įtraukia vartotojo atsiliepimus į savo kūrimo ciklą. Išanalizavę, kaip vartotojai sąveikauja su sugeneruotu kodu ir identifikuodami įprastas klaidas ar tobulinimo sritis, kūrėjai gali tiksliai sureguliuoti modelį. Šis iteracinis procesas padeda tobulinti modelio supratimą apie kodavimo užduotis ir sustiprinti bendrą jo rezultatą laikui bėgant [4].

apribojimai ir iššūkiai

Nepaisant šių priemonių, „Deepseek Coder“ vis dar susiduria su iššūkiais dėl kontekstinio supratimo ir žmogaus sprendimo. Retkarčiais jis gali generuoti kodą, kuris nepriekaištingai atitinka vartotojo reikalavimus dėl priklausomybės nuo mokymo duomenų, kurie gali būti neišsamūs ar šališki [2] [5]. Be to, nors jis puikiai supranta kodo fragmentus, jam trūksta kritinio mąstymo galimybių, būdingų žmonių programuotojams, o tai gali sukelti mažiau optimalių sprendimų [2].

Apibendrinant galima pasakyti, kad „Deepseek Coder“ užtikrina tikslumą per didelius mokymus dideliame duomenų rinkinyje, griežtai palygindamas prieš nustatytas kodavimo užduotis ir nuolatinį tobulinimą, pagrįstą vartotojų sąveika ir atsiliepimais. Tačiau vartotojai turėtų žinoti apie savo apribojimus visiškai suprantant kontekstą ir pritaikyti žmogaus sprendimus.

Citatos:
[1] https://huggingface.co/mcanoglu/deepseek-ai-deepseek-coder-1.3b-base-finetuned-defect-detection
[2] https://dataloop.ai/library/model/deepseek-ai_deepseek-coder-33b-instruct/
[3] https://www.reddit.com/r/localllama/comments/1Acjpn7/deepseekcoder_when_the_large_language_model_meets/
[4] https://www.restack.io/p/deepseek-coder-answer-program-synthesis-cat-ai
[5] https://play.ht/blog/deepseek-v3-vs-r1-vs-coder/
[6] https://arxiv.org/html/2406.11931v1
[7] https://www.datacamp.com/blog/deepseek-r1-lite-preview
[8] https://arxiv.org/pdf/2401.14196.pdf