„Deepseek-R1“ prieš „Cohere“ komandą R (2024 m. Rugpjūčio mėn.): Išsamus palyginimas

Kokie yra pagrindiniai „Deepseeek-R1“ ir „Corhere“ komandų R (2024 m. Rugpjūčio mėn.) Skirtumai (2024 m. Rugpjūčio mėn.)

„Deepseek-R1“ ir „Cohere“ komanda R (2024 m. Rugpjūčio mėn.) Yra pažangios kalbos modeliai, tačiau jie pasižymi skirtingais našumo, architektūros ir kainų skirtumais.

Architektūra ir mokymai:
-„Deepseeek-R1“ yra 671 milijardo parametrų ekspertų (MOE) modelis, turintis 37 milijardus aktyvuotų parametrų kiekvienam prieigos raktui. Jis buvo apmokytas naudojant didelio masto stiprinimo mokymąsi, daugiausia dėmesio skiriant samprotavimo galimybėms. Šis modelis apima du sustiprinimo mokymosi etapus ir du prižiūrimų tikslinių derinimo etapus, siekiant sustiprinti samprotavimus ir nepagrįstus sugebėjimus [1] [3].
- „Command R“ (2024 m. Rugpjūčio mėn.), Sukurtas „COHERE“, pasižymi patobulintomis daugiakalbėmis daugiakalbių atvežamų rinkliavų karta (RAG) ir įrankių naudojimo galimybėmis. Jis pasižymi matematikos, kodo ir samprotavimo užduotimis, pateikdamas rezultatus, panašius į jo pirmtaką, komandą R+[1] [3].

Našumo etalonai:
- „Deepseek-R1“ atlieka palyginti su Openai O1 modeliu daugelyje samprotavimų etalonų, įskaitant matematikos ir kodų užduotis. Jis pasižymi tokiomis kūrybinėmis ir ilgalaikėmis užduotimis, tokiomis kaip „Alpacaeval 2.0“ ir „Arenahard“, pralenkdamas kitus modelius šiose srityse [2]. „Deepseek-R1“ surinko 90,8% MMLU etalono ir 84% MMLU-PRO, parodydamas stiprias samprotavimo galimybes [1].
- Komanda R (2024 m. Rugpjūčio mėn.) Pasiekia 67% MMLU etalono balą ir 70%- humanevale, tai rodo tvirtą kodo generavimo ir problemų sprendimo rezultatą [1]. Tačiau nepranešama apie jo našumą MMLU-PRO ir kitus konkrečius samprotavimo etalonus.

Kainos ir išlaidos:
- „Deepseeek-R1“ yra žymiai brangesnis nei „Command R“ (2024 m. Rugpjūčio mėn.), O įvesties išlaidos siekia 0,55 USD už milijoną žetonų, o produkcijos išlaidos- 2,19 USD už milijoną žetonų. Tai daro maždaug 3,7 karto brangesnį tiek įvesties, tiek išėjimo žetonams [1] [3].
- Komanda R (2024 m. Rugpjūčio mėn.) Siūlo mažesnes išlaidas, kurių įvesties žetonai kainuoja 0,15 USD milijonui, o išvesties žetonai - 0,60 USD už milijoną [1] [4].

Atviras kodas ir bendruomenė:
-„Deepseek-R1“ yra atviro kodo, leidžiantis patobulinti bendruomenę ir modifikacijas. Šis atvirumas gali sukelti skaidresnes vystymosi ir pritaikymo galimybes [1] [5].
- Komanda R (2024 m. Rugpjūčio mėn.) Nėra atviro kodo, ribojantis bendruomenės dalyvavimą plėtojant ir pritaikant [1].

Greitas jautrumas:
-„Deepseeek-R1“ yra jautrus raginimams, nes keli kadtrai dažnai pablogina jo našumą. Norint optimaliems rezultatams, rekomenduojama naudoti „Zero-Shot“ raginimą su aiškiomis instrukcijomis [2].
- Nereikia paminėti greitą „Command R“ (2024 m. Rugpjūčio mėn.) Jautrumą turima informacija.

Apibendrinant galima pasakyti, kad nors abu modeliai turi stiprias samprotavimo galimybes, „Deepseeek-R1“ išsiskiria tam tikruose etalonuose ir siūlo lankstumą atvirojo kodo, tačiau didesnėmis sąnaudomis. Komanda R (2024 m. Rugpjūčio mėn.) Yra ekonomiškesnis ir suteikia konkurencingumą konkrečiose srityse, tokiose kaip kodo generavimas.

Citatos:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-oveview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artifialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artifialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms