Deepseek-R1 und Coheres Befehl R (August 2024) sind beide fortschrittliche Sprachmodelle, zeigen jedoch unterschiedliche Unterschiede in Bezug auf Leistung, Architektur und Preisgestaltung.
Architektur und Training:
-Deepseek-R1 ist ein 671 Milliarden Parametermischungsmischungsmischung (MOE) mit 37 Milliarden aktivierten Parametern pro Token. Es wurde mit einem großflächigen Verstärkungslernen geschult, wobei es sich auf die Argumentationsfähigkeiten konzentrierte. Dieses Modell enthält zwei Phasen des Verstärkungslernens und zwei Phasen der beaufsichtigten Feinabstimmung, um die Argumentation und die Nicht-Begrenzungsfähigkeiten zu verbessern [1] [3].
- Kommando R (Aug 2024), entwickelt von Cohere, verfügt über verbesserte mehrsprachige Abrufgeneration (LAB) und Werkzeugnutzungsfunktionen. Es zeichnet sich in Mathematik-, Code- und Argumentationsaufgaben aus und liefert Ergebnisse, die mit seinem Vorgänger vergleichbar sind, Befehl r+[1] [3].
Performance -Benchmarks:
- Deepseek-R1 führt vergleichsweise mit dem O1-Modell von OpenAI für viele Argumentationsbenchmarks, einschließlich Mathematik- und Codeaufgaben, aus. Es zeichnet sich in kreativen und langkontexten Aufgaben wie AlpaCaeval 2.0 und Arenahard aus und übertrifft andere Modelle in diesen Bereichen [2]. Deepseek-R1 erzielte bei der MMLU-Benchmark 90,8% und bei MMLU-Pro 84% und zeigte starke Argumentationsfähigkeiten [1].
- Befehl R (August 2024) erzielt eine Punktzahl von 67% für die MMLU-Benchmark und 70% für Humaneval, was auf eine solide Leistung bei der Erzeugung von Code und bei der Problemlösung hinweist [1]. Die Leistung von MMLU-PRO und anderen spezifischen Argumentationsbenchmarks wird jedoch nicht gemeldet.
Preisgestaltung und Kosten:
- Deepseek-R1 ist deutlich teurer als das Kommando R (Aug 2024), wobei die Inputkosten von 0,55 USD pro Million Token und Ausgangskosten bei 2,19 USD pro Million Tokens. Dies macht es sowohl für Eingangs- als auch für Ausgangs -Token ungefähr 3,7 -mal teurer [1] [3].
- Kommando R (August 2024) bietet niedrigere Kosten, wobei die Input -Token bei 0,15 USD pro Million und Output -Token bei 0,60 USD pro Million [1] [4] kosten.
Open-Source und Community:
-Deepseek-R1 ist Open-Source, die gemeindebetriebene Verbesserungen und Modifikationen ermöglichen. Diese Offenheit kann zu transparenteren Entwicklungs- und Anpassungsmöglichkeiten führen [1] [5].
- Kommando R (August 2024) ist keine Open-Source, wodurch die Beteiligung der Gemeinschaft an seiner Entwicklung und Anpassung einschränkt [1].
sofortige Empfindlichkeit:
-Deepseek-R1 reagiert empfindlich gegenüber Eingabeaufforderungen, wobei nur wenige Schüsse dazu veranlassen, die Leistung häufig zu beeinträchtigen. Es wird empfohlen, mit klaren Anweisungen für optimale Ergebnisse zu null-shot-Aufforderung zu verwenden [2].
- In den verfügbaren Informationen gibt es keine spezifische Erwähnung der sofortigen Empfindlichkeit für den Befehl R (Aug 2024).
Zusammenfassend lässt sich sagen, dass beide Modelle starke Argumentationsfunktionen aufweisen, Deepseek-R1 in bestimmten Benchmarks auszeichnet und eine Open-Source-Flexibilität bietet, jedoch zu höheren Kosten. Befehl R (August 2024) ist kostengünstiger und bietet eine Wettbewerbsleistung in bestimmten Bereichen wie der Codegenerierung.
Zitate:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/Listof-llms