Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Aké sú hlavné rozdiely vo výkone medzi príkazom Deepseek-R1 a Cohere R (august 2024)


Aké sú hlavné rozdiely vo výkone medzi príkazom Deepseek-R1 a Cohere R (august 2024)


Príkaz Deepseek-R1 a Cohere R (august 2024) sú modely pokročilých jazykov, ale vykazujú zreteľné rozdiely vo výkone, architektúre a cenách.

Architektúra a školenie:
-DeepSeek-R1 je model zmesi parametrov 671 miliárd parametrov (MOE), s 37 miliardami aktivovaných parametrov na token. Bol trénovaný pomocou rozsiahleho posilňovacieho učenia so zameraním na schopnosti zdôvodňovania. Tento model obsahuje dve fázy posilňovacieho učenia a dve fázy pod dohľadom doladenia s cieľom zvýšiť zdôvodnenie a neoficiálne schopnosti [1] [3].
- Príkaz R (august 2024), vyvinutý spoločnosťou Cohere, obsahuje vylepšené viacjazyčné možnosti generovania (RAG) a použitia nástroja. Vyniká v matematických, kódových a zdôvodňovacích úlohách a poskytuje výsledky porovnateľné s jej predchodcom, príkaz R+[1] [3].

Performance Benchmarks:
- DeepSeek-R1 funguje porovnateľne s modelom O1 o O1 v mnohých referenčných hodnotách, vrátane matematických a kódových úloh. Vyniká v kreatívnych a dlhých kontextoch, ako sú Alpacaeval 2.0 a Arenahard, čo prevyšuje ďalšie modely v týchto oblastiach [2]. Deepseek-R1 zaznamenal 90,8% na meradle MMLU a 84% na MMLU-PRO, čo preukazuje silné schopnosti uvažovania [1].
- Príkaz R (august 2024) dosahuje skóre 67% na meradle MMLU a 70% na HumaneVal, čo naznačuje solídny výkon pri generovaní kódu a riešení problémov [1]. Jeho výkon na MMLU-PRO a ďalších špecifických referenčných hodnotách zdôvodnenia však nie je uvedený.

Ceny a náklady:
- Deepseek-R1 je výrazne drahší ako príkaz R (august 2024), pričom vstupné náklady na 0,55 USD za milión tokenov a náklady na výstup na 2,19 dolárov za milión tokenov. Vďaka tomu je zhruba 3,7 -krát drahšie pre vstupné aj výstupné tokeny [1] [3].
- Príkaz R (august 2024) ponúka nižšie náklady, so vstupnými tokenmi za 0,15 USD za milión a výstupné žetóny na 0,60 USD za milión [1] [4].

Open-Source and Community:
-Deepseek-R1 je otvoreným zdrojom, ktorý umožňuje zlepšenia a úpravy založené na komunite. Táto otvorenosť môže viesť k transparentnejším možnostiam vývoja a prispôsobenia [1] [5].
- Príkaz R (august 2024) nie je otvoreným zdrojom, ktorý obmedzuje zapojenie komunity do jej vývoja a prispôsobenia [1].

Prámová citlivosť:
-DeepSeek-R1 je citlivý na výzvy, pričom málo výziev, ktoré sa často vyvoláva, často degraduje jeho výkon. Odporúča sa používať výzvu na nulové výbehy s jasnými pokynmi pre optimálne výsledky [2].
- V dostupných informáciách nie je žiadna konkrétna zmienka o rýchlej citlivosti na príkaz R (august 2024).

Stručne povedané, zatiaľ čo oba modely majú silné schopnosti uvažovania, Deepseek-R1 vyniká v určitých referenčných hodnotách a ponúka flexibilitu s otvoreným zdrojom, ale za vyššiu cenu. Príkaz R (august 2024) je nákladovo efektívnejší a poskytuje konkurenčný výkon v konkrétnych oblastiach, ako je generovanie kódu.

Citácie:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-model-wow-and- --tow-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms