Peamised erinevused
arhitektuur ja disain **
- Deepseek Coder V1 oli alusmudel, mis keskendus peamiselt koodide genereerimisele ja analüüsile. See ehitati traditsioonilise trafo arhitektuuri abil ja selle konteksti pikkus oli piiratud 16 000 žetooniga.-Hiljem vabastatud Deepseek Coder V2 kasutab täiustatud kogemuste segu (MOE) arhitektuuri, mis võimaldab tal tõhusamalt töödelda keerukamaid ülesandeid. See mudel toetab palju pikemat konteksti pikkust 128 000 märgi, parandades märkimisväärselt selle võimet käsitleda suuremaid koodilõigud ja keerukamad päringud.
koolituse andmed ja jõudlus **
- Treeninguandmed: Coder V1 koolitati umbes 2 triljoni märgi korral, segu 87% koodi ja 13% -lise loomuliku keelega. Seevastu Coder V2 läbis täiendava 6 triljoni žetooniga eelneva koolituse, suurendades selle kodeerimise ja matemaatiliste mõttekäikude võimalusi väljaspool eelkäijat.-jõudluse võrdlusalused: Coder V2 on näidanud paremat jõudlust erinevates kodeerimise võrdlusalustes, võrreldes nii Coder V1 kui ka muude suletud lähtekoodiga mudelitega, näiteks GPT4-turboga. See paistab silma eriti ülesannetes, mis hõlmavad matemaatilisi mõttekäike koodeksi piires, tutvustades edusamme nii arutluskäigu kui ka üldiste keelevõimaluste osas.
programmeerimiskeele tugi **
- Coder V1 toetas piiratud hulga programmeerimiskeeli. Kuid Coder V2 on seda tuge dramaatiliselt laiendanud 86 -le 338 -le programmeerimiskeelele, muutes selle erinevates kodeerimiskeskkondades töötavate arendajate jaoks palju mitmekülgsemaks.Parameetrite arv **
- Mõlemal mudelil on sama parameetri arv 236 miljardit **; Kuid aktiivsed parameetrid erinevad pisut. Coderi V2 baasmudelis on 2,4 miljardit aktiivset parameetrit ja 21 miljardit juhendamismudelist, mis on optimeeritud juhendamisjärgsete ülesannete täitmiseks.Kasutage juhtumeid **
- Kuigi Deepseek Coder V1 oli sobiv põhiliste kodeerimise ülesannete jaoks, on Coder V2 spetsiaalselt optimeeritud laiema kodeerimisrakenduste massiivi jaoks, sealhulgas, kuid mitte ainult, koodide valmimine, sisestamine, automatiseeritud koodide ülevaatamine ja jõudluse optimeerimise soovitused.Kokkuvõtlikult esindab Deepseek Coder V2 olulist versiooni V1 suhtes oma täiustatud arhitektuuri, laiendatud programmeerimiskeele tugi, täiustatud koolituste andmete kasutamise ja parema jõudluse mõõdikutega erinevates kodeerimise võrdlusalustes.
Tsitaadid:
[1] https://huggingface.co/deepseek-ai/deepseek-coder-v2-base
]
[3] https://play.ht/blog/deepseek-v3-vs-r1-vs-coder/
[4] https://arxiv.org/html/2406.11931v1
[5] https://deepgram.com/learn/best-local-coding-llm
]
[7] https://deepseekcoder.github.io
[8] https://arxiv.org/pdf/2406.11931.pdf
[9] https://github.com/deepseek-ai/deepseek-coder/?tab=readme-ov-file