Deepseek-R1 ja Cohere käsk R (august 2024) on mõlemad täiustatud keelemudelid, kuid neil on selged erinevused jõudluses, arhitektuuris ja hinnakujunduses.
arhitektuur ja koolitus:
-Deepseek-R1 on 671 miljardi parameetri segu (MOE) mudel, millel on 37 miljardit aktiveeritud parameetrit tokeni kohta. Seda koolitati suuremahulise tugevdusõppe abil, keskendudes mõttekäikudele. See mudel hõlmab kahte tugevdusõppe etappi ja juhendatud peenhäälestamise kahte etappi, et parandada mõttekäiku ja mittesuhteid [1] [3].
- Command R (august 2024), mille on välja töötanud Cohere, omab täiustatud mitmekeelset otsinguga austatud genereerimist (RAG) ja tööriistade kasutamise võimalusi. See paistab silma matemaatika-, koodi- ja mõttekäikude osas, pakkudes tulemusi, mis on võrreldavad selle eelkäijaga, käsu R+[1] [3].
jõudluse võrdlusalused:
- Deepseek-R1 toimib OpenAi O1 mudeliga võrreldavalt paljudes mõttekäikudes, sealhulgas matemaatika- ja koodiülesannetes. See paistab silma sellistes loomingulistes ja pikakonteksti ülesannetes nagu Alpacaeval 2.0 ja Arenahard, edestades nendes piirkondades muid mudeleid [2]. Deepseek-R1 saavutas MMLU võrdlusalusel 90,8% ja MMLU-Pro 84%, näidates tugevaid mõttekäiku [1].
- Command R (august 2024) saavutab MMLU võrdlusaluse tulemuse 67% ja 70% Humanevalil, mis näitab koodide genereerimise ja probleemide lahendamise kindlat jõudlust [1]. Selle jõudlust MMLU-Pro ja muude konkreetsete mõttekäikude osas ei ole siiski teatatud.
Hinnakujundus ja maksumus:
- Deepseek-R1 on oluliselt kallim kui Command R (august 2024), sisendkulud on 0,55 dollarit miljoni tokeni ja toodangukuludega 2,19 dollarit miljoni tokeni kohta. See muudab selle umbes 3,7 korda kallimaks nii sisend- kui ka väljundmärkide jaoks [1] [3].
- Command R (august 2024) pakub madalamaid kulusid, sisestusmärkide hind on 0,15 dollarit miljoni kohta ja väljundmärgid 0,60 dollarit miljoni kohta [1] [4].
avatud lähtekoodiga ja kogukond:
-Deepseek-R1 on avatud lähtekoodiga, võimaldades kogukonnapõhiseid parandusi ja modifikatsioone. See avatus võib põhjustada läbipaistvamaid arengu- ja kohandamisvõimalusi [1] [5].
- Command R (august 2024) ei ole avatud lähtekoodiga, piirates kogukonna kaasamist selle arendamisel ja kohandamisel [1].
kiire tundlikkus:
-DeepSEEK-R1 on tundlik viigimise suhtes, vähesed laskud halvendavad sageli selle jõudlust. Optimaalsete tulemuste saamiseks on soovitatav kasutada null-laskutsemist koos selgete juhistega [2].
- Käsu R suhtes ei mainita täpset tundlikkust (august 2024) saadaolevas teabes.
Kokkuvõtlikult võib öelda, et kuigi mõlemal mudelil on tugevad mõttekäigud, paistab DeepSEEK-R1 silma teatud võrdlusalustes ja pakub avatud lähtekoodiga paindlikkust, kuid kõrgemate kuludega. Command R (august 2024) on kulutõhusam ja pakub konkurentsivõimelisi jõudlust konkreetsetes valdkondades, näiteks koodide genereerimine.
Tsitaadid:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
]
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms