Kuidas mõjutab 87% -lise koodi ja 13% -lise loomuliku keele koosseis Deepseek Coderi jõudlust

See ainulaadne segu võimaldab mudelil silma paista erinevates kodeerimisülesannetes, säilitades samal ajal programmeerimiskeelte tugeva kontekstuaalse mõistmise.

Koodi kompositsiooni mõju

1. Täiustatud kodeerimise jõudlus: koolitusandmete kõrge protsent võimaldab DeepSEEK-kooderil saavutada tipptasemel tulemusi kodeerimisvõlangute nagu Humaneval ja MBPP-ga, mille tulemused ulatuvad kuni 90,2% täpsusega ** [1] [1] [1] [1] 5]. See jõudlus ületab paljusid olemasolevaid avatud lähtekoodiga ja patenteeritud mudeleid, mis näitab, et mudel on eriti vilunud täpsete koodilõigude genereerimisel.

2. Loodusliku keele mõistmine: 13% looduslike keeleandmete lisamine, peamiselt inglise ja hiina keeles, suurendab mudeli võimet mõista ja genereerida kommentaare, dokumente ja kasutusjuhiseid. See keeleline kontekst on ülioluline ülesannete jaoks, mis nõuavad mitte ainult koodide genereerimist, vaid ka selgitusi või interaktsioone loomulikus keeles, muutes mudeli mitmekülgseks erinevates programmeerimisstsenaariumides [2] [4].

3. Kontekstuaalne teadlikkus: Deepseek Coder kasutab hoidla tasemel koolitust, mis võimaldab tal mõista projektide piiresõltuvusi. Seda võimekust tugevdavad ulatuslikud koodiandmed, võimaldades sellel lahendada keerulisi kodeerimisprobleeme, mis hõlmavad tõhusalt mitut faili [1]. Mudeli võime säilitada konteksti pikkade järjestustega (kuni 16 384 žetooni, pikendatav 128K **) suurendab veelgi selle jõudlust suuremahuliste tarkvaraprojektide puhul [1].

4. Täitke keskmise (FIM) koolitus: see uuenduslik koolitusstrateegia võimaldab mudelil koodi genereerida, täites lüngad olemasolevate koodiplokkide piires. Märkimisväärne koodiandmete arv toetab seda funktsiooni, parandades mudeli silumis- ja koodide lõpuleviimise võimeid, mis on arendajatele kriitilise tähtsusega [1] [3].

5. Juhendi häälestamine: mudel läbib käskude häälestamise täiendavate andmete abil, mis sisaldavad nii koodi kui ka loomuliku keele juhiseid. See protsess täpsustab oma võimet reageerida täpselt kasutajapäringutele ja genereerida kontekstiliselt asjakohaseid koodilõigud, võimendades nii selle kodeerimise teadmisi kui ka keelelisi võimalusi [1] [5].

Kokkuvõtlikult võib öelda, et 87% koodi ja 13% -lise loodusliku keele koostis varustab Deepseek Coderi kindlat raamistikku programmeerimissisu tõhusaks mõistmiseks ja genereerimiseks. See tasakaal mitte ainult ei suurenda selle kodeerimise jõudlust, vaid tagab ka selle inimkeeles tõhusa suhtlemise, muutes selle arendajatele võimsaks tööriistaks.

Tsitaadid:
]
[2] https://dataloop.ai/library/model/thebloke_deepseek-coder-67b-base-awq/
[3] https://github.com/deepseek-ai/deepseek-coder/?tab=readme-ov-file
[4] https://huggingface.co/deepseek-ai/deepseek-coder-6.7b-base
[5] https://arxiv.org/html/2406.11931v1
[6] https://arxiv.org/pdf/2401.14196.pdf
[7] https://huggingface.co/deepseek-ai/deepseek-coder-1.3b-base
[8] https://dataloop.ai/library/model/deepseek-ai_deepseek-coder-67b-instruct/