A DeepSeek-R1 és a Cohere Parancsnoka (2024 augusztus) egyaránt fejlett nyelvmodellek, ám ezek különböznek a teljesítmény, az építészet és az árazás szempontjából.
Építészet és képzés:
-A DeepSeek-R1 egy 671 milliárd paraméterkeverék (MOE) modell, 37 milliárd aktivált paraméterrel, tokenre. A nagyszabású megerősítő tanulással kiképezték, az érvelési képességekre összpontosítva. Ez a modell magában foglalja a megerősítés tanulásának két szakaszát és a felügyelt finomhangolás két szakaszát az érvelési és nem indoklási képességek javítása érdekében [1] [3].
- Az R parancsnokság (2024 augusztus), a Cohere által kifejlesztett, továbbfejlesztett többnyelvű visszakeresési-augnázott generáció (RAG) és szerszámhasználati képességeket tartalmaz. Kitűnő a matematikai, kód- és érvelési feladatokban, az elődjével összehasonlítható eredményeket, az R+[1] [3] parancsot.
Teljesítmény -referenciaértékek:
- A DeepSeek-R1 összehasonlíthatóan teljesíti az Openai O1 modelljét számos érvelési referenciaértékben, beleértve a matematikai és kódfeladatokat. Kitűnő a kreatív és hosszú kontextusú feladatokban, mint például az Alpacaeval 2.0 és az ArenAhard, felülmúlva a többi modellt ezeken a területeken [2]. A DeepSeek-R1 90,8% -ot ért el az MMLU referenciaértékén és 84% -ot az MMLU-Pro-nál, erős érvelési képességeket mutatva [1].
- Az R parancsnok (2024 augusztus) 67% -os pontszámot ér el az MMLU referenciaértékén és 70% -ot a HumaneVal-nál, jelezve a szilárd teljesítményt a kódgenerálásban és a problémamegoldásban [1]. Az MMLU-PRO-nál és más konkrét érvelési referenciaértékek teljesítményéről azonban nem jelentettek.
Árképzés és költség:
- A DeepSeek-R1 szignifikánsan drágább, mint az R parancsnok (2024 augusztus), az input költségek 0,55 dollár / millió token, a kibocsátási költségek pedig 2,19 USD / millió token. Ez nagyjából 3,7 -szer drágábbá teszi mind a bemeneti, mind a kimeneti tokenek számára [1] [3].
- Az R parancsnok (2024 augusztus) alacsonyabb költségeket kínál, a bemeneti tokenek ára 0,15 dollár / millió, a output tokeneket pedig 0,60 dolláronként [1] [4].
Nyílt forrású és közösség:
-A DeepSeek-R1 nyílt forráskódú, lehetővé téve a közösség által vezérelt fejlesztéseket és módosításokat. Ez a nyitottság átláthatóbb fejlesztési és testreszabási lehetőségekhez vezethet [1] [5].
- Az R parancsnok (2024 augusztus) nem nyílt forráskódú, korlátozva a közösség részvételét a fejlesztésben és a testreszabásban [1].
Gyors érzékenység:
-A DeepSeek-R1 érzékeny a utasításokra, néhány lövéssel gyakran romlik a teljesítménye. Javasoljuk, hogy a nulla lövés felszólítást használja, az optimális eredmények elérése érdekében egyértelmű utasításokkal [2].
- A rendelkezésre álló információkban nem említik az R parancs azonnali érzékenységét (2024 augusztus).
Összefoglalva: bár mindkét modellnek erős érvelési képességei vannak, a DeepSeek-R1 bizonyos referenciaértékekben kiemelkedik, és nyílt forráskódú rugalmasságot kínál, de magasabb költségekkel. Az R parancsnok (2024 augusztus) költséghatékonyabb és versenyképes teljesítményt nyújt olyan területeken, mint a kódgenerálás.
Idézetek:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r--model-overview-and-how-it-tanks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://articialanalysis.ai/models/command-r
[5] https://blog.prompptlayer.com/deepseek-r1-vs-o1/
[6] https://articialanalysis.ai/models
[7] https://articialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-lllms