DeepSeek-R1 против Команда Cohere R (август 2024 г.): полное сравнение

DeepSeek-R1 и Cohere Command R (август 2024 г.) являются современными языковыми моделями, но они демонстрируют четкие различия в производительности, архитектуре и ценах.

Архитектура и обучение:
-DeepSeek-R1-это модель модели параметров параметров 671 млрд. Параметров (MOE) с 37 миллиардами активированных параметров на токен. Он был обучен с использованием крупномасштабного обучения подкреплению, сосредоточившись на возможностях рассуждения. Эта модель включает в себя два этапа обучения подкрепления и два этапа контролируемой точной настройки для повышения мышлений и неэдижных способностей [1] [3].
- Команда R (август 2024 г.), разработанный COUERE, функционирует улучшенные многоязычные возможности поколения (RAG) и инструмента. Он превосходит задачи по математике, коду и рассуждениям, предоставляя результаты, сравнимые с его предшественником, команда R+[1] [3].

Процедуры производительности:
- DeepSeek-R1 выполняет сравнительно с моделью O1 OpenAI во многих критериях рассуждений, включая задачи по математике и коде. Он превосходит творческие и длинные задачи, такие как Alpacaeval 2.0 и Arenahard, опережая другие модели в этих областях [2]. DeepSeek-R1 набрал 90,8% на эталон MMLU и 84% на MMLU-Pro, демонстрируя сильные возможности рассуждений [1].
- Command R (август 2024) достигает 67% по эталону MMLU и 70% на Humaneval, что указывает на солидную производительность в генерации кода и решении проблем [1]. Тем не менее, его производительность на MMLU-PRO и других конкретных показателях рассуждений не сообщается.

Цены и стоимость:
- DeepSeek-R1 значительно дороже, чем команда R (август 2024 г.), при этом затраты на входные расходы составляют 0,55 долл. США на токены и производственные затраты в размере 2,19 долл. США на токены. Это делает его примерно в 3,7 раза дороже как для входных, так и для выходных токенов [1] [3].
- Команда R (август 2024 г.) предлагает более низкие затраты, при этом входные токены по цене 0,15 долл. США за миллион и токены выхода на уровне 0,60 долл. США за миллион [1] [4].

Открытый источник и сообщество:
-DeepSeek-R1-это открытый источник, что позволяет улучшить и модификации, управляемые сообществом. Эта открытость может привести к более прозрачной разработке и настройке [1] [5].
- Команда R (август 2024 г.) не является открытым исходным кодом, ограничивая участие сообщества в его разработке и настройке [1].

Обратная чувствительность:
-DeepSeek-R1 чувствителен к подсказкам, с небольшим количеством выстрелов, часто ухудшающих его производительность. Рекомендуется использовать подсказку с нулевым выстрелом с четкими инструкциями для оптимальных результатов [2].
- Нет особого упоминания о быстром чувствительности для команды R (август 2024 г.) в доступной информации.

Таким образом, в то время как обе модели обладают сильными возможностями рассуждений, DeepSeek-R1 превосходен в определенных тестах и предлагает гибкость с открытым исходным кодом, но при более высоких затратах. Команда R (август 2024 г.) является более экономически эффективной и обеспечивает конкурентную эффективность в определенных областях, таких как генерация кода.

Цитаты:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-llms

Каковы основные различия в производительности между DeepSeek-R1 и Cohere Command R (август 2024 г.)