Deepseek-R1 vs Cohere's Command R (Aug 2024): En omfattande jämförelse

Vilka är de viktigaste skillnaderna i prestanda mellan Deepseek-R1 och Cohere's Command R (Aug 2024)

Deepseek-R1 och Cohere's Command R (Aug 2024) är båda avancerade språkmodeller, men de uppvisar distinkta skillnader i prestanda, arkitektur och prissättning.

Arkitektur och utbildning:
-Deepseek-R1 är en 671 miljarder parameterblandning av experter (MOE) -modellen, med 37 miljarder aktiverade parametrar per token. Det tränades med storskalig förstärkningslärande, med fokus på resonemang. Denna modell innehåller två stadier av förstärkningsinlärning och två stadier av övervakad finjustering för att förbättra resonemang och icke-reasoning förmågor [1] [3].
- Kommando R (Aug 2024), utvecklad av Cohere, har förbättrad flerspråkig återhämtningsförstärkt generation (RAG) och verktygsanvändningsfunktioner. Det utmärker sig i matematik, kod och resonemangsuppgifter, vilket ger resultat som är jämförbara med föregångaren, kommandot R+[1] [3].

Performance Benchmarks:
- Deepseek-R1 utför jämförbart med OpenAI: s O1-modell över många resonemangsreenchmarks, inklusive matematik och koduppgifter. Det utmärker sig i kreativa och långa kontextuppgifter som Alpacaeval 2.0 och Arenahard, vilket överträffar andra modeller i dessa områden [2]. Deepseek-R1 fick 90,8% på MMLU-riktmärket och 84% på MMLU-PRO, vilket visade starka resonemangskapaciteter [1].
- Kommando R (augusti 2024) uppnår en poäng på 67% på MMLU-riktmärket och 70% på humaneval, vilket indikerar solid prestanda i kodgenerering och problemlösning [1]. Emellertid rapporteras inte dess prestanda på MMLU-Pro och andra specifika resonemang.

Prissättning och kostnad:
- Deepseek-R1 är betydligt dyrare än kommandot R (augusti 2024), med ingångskostnader till $ 0,55 per miljon tokens och utgångskostnader till 2,19 dollar per miljon tokens. Detta gör det ungefär 3,7 gånger dyrare för både ingångs- och utgångstokens [1] [3].
- Command R (Aug 2024) erbjuder lägre kostnader, med inputtokens prissatta till $ 0,15 per miljon och utgångstokens till 0,60 dollar per miljon [1] [4].

Öppen källkod och gemenskap:
-Deepseek-R1 är öppen källkod, vilket möjliggör samhällsstyrda förbättringar och modifieringar. Denna öppenhet kan leda till mer transparenta utvecklings- och anpassningsmöjligheter [1] [5].
- Command R (Aug 2024) är inte öppen källkod, vilket begränsar samhällsengagemanget i sin utveckling och anpassning [1].

Snabb känslighet:
-Deepseek-R1 är känslig för instruktioner, med få skott som ofta förnedrar dess prestanda. Det rekommenderas att använda nollskott som uppmanas med tydliga instruktioner för optimala resultat [2].
- Det finns inget specifikt omnämnande av snabb känslighet för kommando R (augusti 2024) i tillgänglig information.

Sammanfattningsvis, medan båda modellerna har starka resonemang, utmärker Deepseek-R1 i vissa riktmärken och erbjuder öppen källkods flexibilitet, men till en högre kostnad. Kommando R (Aug 2024) är mer kostnadseffektivt och ger konkurrenskraftiga prestanda inom specifika områden som kodgenerering.

Citeringar:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
]
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r-rid
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms