Deepseek-R1 vs Coere a comanda R (august 2024): o comparație cuprinzătoare

Care sunt principalele diferențe de performanță între Deepseek-R1 și Comanda lui Coere R (august 2024)

Deepseek-R1 și Coere's Command R (august 2024) sunt ambele modele de limbaj avansat, dar prezintă diferențe distincte de performanță, arhitectură și prețuri.

Arhitectură și instruire:
-DeepSeek-R1 este un model de amestec de 671 miliarde de parametri (MOE), cu 37 de miliarde de parametri activi pe jeton. Acesta a fost instruit folosind învățarea de întărire la scară largă, concentrându-se pe capacitățile de raționament. Acest model încorporează două etape de învățare întărită și două etape de reglare fină supravegheată pentru a îmbunătăți raționamentul și abilitățile de neasonant [1] [3].
- Comanda r (august 2024), dezvoltată de Cohere, oferă o generație de regăsire multilingvă îmbunătățită (RAG) și capacități de utilizare a instrumentelor. Excelimentează în sarcinile de matematică, cod și raționament, oferind rezultate comparabile cu predecesorul său, comanda R+[1] [3].

Benchmark -uri de performanță:
- DeepSeek-R1 funcționează în mod comparabil cu modelul O1 O1 al OpenAI în mai multe repere de raționament, inclusiv sarcini de matematică și cod. Excelimentează în sarcini creative și cu context lung, cum ar fi Alpacaeval 2.0 și Arenahard, depășind alte modele din aceste domenii [2]. Deepseek-R1 a obținut 90,8% pe etalonul MMLU și 84% pe MMLU-PRO, demonstrând capacități de raționament puternice [1].
- Comanda R (august 2024) atinge un scor de 67% pe referința MMLU și 70% pe Humeval, ceea ce indică performanțe solide în generarea de coduri și rezolvarea problemelor [1]. Cu toate acestea, performanța sa pe MMLU-PRO și alte repere de raționament specifice nu este raportată.

Preț și costuri:
- DeepSeek-R1 este semnificativ mai scump decât comanda R (august 2024), cu costurile de intrare la 0,55 USD pe milion de jetoane și costuri de ieșire la 2,19 dolari pe milion de jetoane. Acest lucru îl face de aproximativ 3,7 ori mai scump atât pentru jetoane de intrare, cât și pentru ieșire [1] [3].
- Comanda R (august 2024) oferă costuri mai mici, cu jetoane de intrare la un preț de 0,15 USD pe milion și jetoane de ieșire la 0,60 USD pe milion [1] [4].

open-source și comunitate:
-Deepseek-R1 este open-source, permițând îmbunătățiri și modificări bazate pe comunitate. Această deschidere poate duce la posibilități de dezvoltare și personalizare mai transparente [1] [5].
- Comanda R (august 2024) nu este open-source, limitând implicarea comunității în dezvoltarea și personalizarea sa [1].

Sensibilitate promptă:
-DeepSeek-R1 este sensibil la prompturi, cu puține lovituri care au degradat deseori degradându-și performanța. Este recomandat să utilizați o solicitare zero cu instrucțiuni clare pentru rezultate optime [2].
- Nu există nicio mențiune specifică a sensibilității prompte pentru comanda r (august 2024) în informațiile disponibile.

În rezumat, în timp ce ambele modele au capacități de raționament puternice, Deepseek-R1 excelează în anumite repere și oferă flexibilitate open-source, dar cu un cost mai mare. Comanda r (august 2024) este mai rentabilă și oferă performanțe competitive în anumite domenii precum generarea de coduri.

Citări:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
]
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms