DeepSeek-R1 un Coure komanda R (2024. gada augusts) ir uzlaboti valodu modeļi, taču tiem ir atšķirīgas atšķirības veiktspējas, arhitektūras un cenu noteikšanā.
Arhitektūra un apmācība:
-DeepSEEK-R1 ir 671 miljarda parametru ekspertu maisījuma (MOE) modelis ar 37 miljardiem aktivētiem parametriem uz marķiera. Tas tika apmācīts, izmantojot liela mēroga pastiprināšanas mācīšanos, koncentrējoties uz spriešanas iespējām. Šis modelis ietver divus pastiprināšanas mācīšanās posmus un divus uzraudzīta precizēšanas posmus, lai uzlabotu spriešanu un nesaskaņojošas spējas [1] [3].
- Komanda R (2024. gada augusts), ko izstrādājusi Coirere, ir uzlabotas daudzvalodu izguves, kas veidotas paaudze (RAG) un instrumentu izmantošanas iespējas. Tas izceļas ar matemātiku, kodu un spriešanas uzdevumiem, nodrošinot rezultātus, kas ir salīdzināmi ar tā priekšgājēju, komandu R+[1] [3].
Veiktspējas etaloni:
- DeepSEEK-R1 daudzos argumentācijas etalonos, ieskaitot matemātikas un koda uzdevumus, darbojas salīdzinoši ar Openai O1 modeli. Tas izceļas ar radošiem un ilgstošiem teksta uzdevumiem, piemēram, Alpacaeval 2.0 un Arenahard, pārspējot citus modeļus šajās jomās [2]. DeepSeek-R1 ieguva 90,8% no MMLU etalona un 84% no MMLU-Pro, demonstrējot spēcīgas spriešanas iespējas [1].
- Komanda R (2024. gada augusts) sasniedz 67% punktu skaitu MMLU etalonā un 70% uz humanevalu, norādot uz stabilu veiktspēju kodu ģenerēšanā un problēmu risināšanā [1]. Tomēr tā sniegums MMLU-Pro un citos īpašos spriešanas etalonos netiek ziņots.
Cenas un izmaksas:
- DeepSEEK-R1 ir ievērojami dārgāks nekā Command R (2024. gada aug.), Ievades izmaksas ir USD 0,55 par miljonu žetonu un izlaides izmaksas ir USD 2,19 par miljonu žetonu. Tas padara aptuveni 3,7 reizes dārgāku gan ieejas, gan izejas žetoniem [1] [3].
- Komanda R (2024. gada augusts) piedāvā zemākas izmaksas, ar ievades marķieriem, kuru cena ir USD 0,15 par miljonu, un izvades žetoni ir USD 0,60 par miljonu [1] [4].
atvērtā koda un kopiena:
-DeepSEEK-R1 ir atvērtā koda, kas ļauj veikt uzlabojumus un modifikācijas uz sabiedrību. Šī atklātība var izraisīt pārredzamākas attīstības un pielāgošanas iespējas [1] [5].
- Komanda R (2024. gada augusts) nav atvērtā koda, kas ierobežo sabiedrības iesaistīšanos tās attīstībā un pielāgošanā [1].
uzvedne jutība:
-DeepSEEK-R1 ir jutīgs pret uzvednēm, un daži šāvienu pamudinājumi bieži pasliktina tā veiktspēju. Ieteicams izmantot nulles šāvienu, ar skaidrām instrukcijām optimāliem rezultātiem [2].
- Pieejamajā informācijā nav īpaša pieminēšanas par ātru jutīgumu pret komandu R (2024. gada augusts).
Rezumējot, kaut arī abiem modeļiem ir spēcīgas spriešanas iespējas, DeepSEEK-R1 izceļas ar noteiktiem etaloniem un piedāvā atvērtā koda elastību, bet par augstākām izmaksām. Komanda R (2024. gada augusts) ir rentablāka un nodrošina konkurētspējīgu veiktspēju noteiktās jomās, piemēram, kodu ģenerēšanā.
Atsauces:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artifialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms