Deepseek-R1 proti Cohere's Command R (avgust 2024): celovita primerjava

Katere so glavne razlike v uspešnosti med Deepseek-R1 in Cohereom ukazom R (avgust 2024)

Deepseek-R1 in Cohere's Command R (avgust 2024) sta modeli naprednih jezikov, vendar kažeta različne razlike v uspešnosti, arhitekturi in cenah.

Arhitektura in usposabljanje:
-Deepseek-R1 je 671 milijarde parametrov mešanic z eksperti (MOE) z 37 milijardami aktiviranih parametrov na žeton. Usposobljena je bila z obsežnim učnim okrepitvijo in se osredotočala na zmožnosti sklepanja. Ta model vključuje dve stopnji okrepljenega učenja in dve stopnji nadzorovanega natančnega nastavitve za izboljšanje sklepanja in nesojenih sposobnosti [1] [3].
- ukaz R (avgust 2024), ki ga je razvil Cohere, odlikuje izboljšana večjezična generacija (RAG) in zmogljivosti uporabe orodij. Odlikuje se pri nalogah matematike, kode in sklepanja, ki zagotavlja rezultate, primerljive s predhodnikom, ukazom R+[1] [3].

Merila uspešnosti:
- Deepseek-R1 deluje primerljivo z OpenAI-jevim modelom O1 v številnih merilih za sklepanje, vključno z matematičnimi in kodnimi nalogami. Odlikuje se pri ustvarjalnih in dolgoletnih nalogah, kot sta Alpacaeval 2.0 in Arenahard, ki presega druge modele na teh območjih [2]. Deepseek-R1 je dosegel 90,8% na referenčni meri MMLU in 84% na MMLU-Pro, kar je pokazalo močne sposobnosti sklepanja [1].
- Command R (avgust 2024) doseže oceno 67% na referenčni vrednosti MMLU in 70% na Humanovalu, kar kaže na trdno uspešnost pri ustvarjanju kode in reševanju problemov [1]. Vendar pa se ne poroča o njegovi uspešnosti na MMLU-Pro in drugih specifičnih merilih sklepanja.

Cene in stroški:
- Deepseek-R1 je bistveno dražji od poveljstva R (avgust 2024), vhodni stroški pa znašajo 0,55 dolarja na milijon žetonov in proizvodnimi stroški v višini 2,19 dolarja na milijon žetonov. Zaradi tega je približno 3,7 -krat dražji tako za vhodne kot izhodne žetone [1] [3].
- Command R (avg 2024) ponuja nižje stroške, z vhodnimi žetoni, ki znašajo 0,15 dolarja na milijon, in žetoni proizvodnje 0,60 dolarja na milijon [1] [4].

odprtokodna in skupnost:
-Deepseek-R1 je odprtokodni, kar omogoča izboljšave in spremembe, ki jih vodijo v skupnosti. Ta odprtost lahko privede do bolj preglednih možnosti razvoja in prilagajanja [1] [5].
- ukaz R (avgust 2024) ni odprtokodni, kar omejuje sodelovanje skupnosti v njen razvoj in prilagajanje [1].

Hitra občutljivost:
-Deepseek-R1 je občutljiv na pozive, pri čemer je nekaj posnetkov pogosto poslabšalo njegovo zmogljivost. Priporočljivo je, da uporabite z ničelnim strelom z jasnimi navodili za optimalne rezultate [2].
- V razpoložljivih informacijah ni posebne omembe hitre občutljivosti za ukaz R (avg 2024).

Če povzamemo, medtem ko imata oba modela močne sposobnosti sklepanja, se Deepseek-R1 odlikuje v določenih merilih in ponuja odprtokodno prilagodljivost, vendar z višjimi stroški. Poveljstvo R (avgust 2024) je stroškovno učinkovitejše in zagotavlja konkurenčno uspešnost na določenih področjih, kot je generiranje kode.

Navedbe:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-Openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artifialanalysis.ai/models/command-r
[5] https://blog.promplayer.com/deepseek-r1-vs-o1/
[6] https://artifialanalysis.ai/models
[7] https://artifialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms