Команда DeepSeek-R1 проти Коуе (серпень 2024): всебічне порівняння

Команда Deepseek-R1 та Cohehers R (серпень 2024)-це обидві модні моделі, але вони демонструють чіткі відмінності в продуктивності, архітектурі та цінах.

Архітектура та навчання:
-Deepseek-R1-це модель 671 мільярда параметрів-експертів (МО) з 37 мільярдами активованих параметрів на токен. Він навчався з використанням масштабного підкріплення навчання, зосереджуючись на можливостях міркувань. Ця модель включає два етапи підкріплення навчання та два етапи контрольованої тонкої настройки для посилення міркувань та здібностей до несезондування [1] [3].
- Команда R (серпень 2024), розроблений Coheh, має посилене багатомовне покоління, що надходить у пошук (RAG) та можливості використання інструментів. Він досконалий у завданнях математики, коду та міркувань, надаючи результати, порівнянні з попередником, командою R+[1] [3].

Оцінки продуктивності:
- Deepseek-R1 виконує порівняно з моделлю O1 Opeai у багатьох орієнтирах міркувань, включаючи завдання з математики та коду. Він переважає в творчих та довгого контекстних завдань, таких як Alpacaeval 2.0 та Arenahard, перевершуючи інші моделі в цих областях [2]. DeepSeek-R1 набрав 90,8% на орієнтир MMLU та 84% на MMLU-Pro, демонструючи сильні можливості міркувань [1].
- Команда R (серпень 2024) досягає оцінки 67% на орієнтир MMLU та 70% на Humaneval, що вказує на суцільну продуктивність у генерації коду та вирішення проблем [1]. Однак його ефективність щодо MMLU-Pro та інших конкретних міркувань не повідомляється.

Ціни та вартість:
- DeepSeek-R1 значно дорожчий, ніж Command R (серпень 2024), з вхідними витратами- 0,55 долара за мільйон жетонів та витрат на виробництво- 2,19 долара за мільйон жетонів. Це робить його приблизно в 3,7 рази дорожчим як для вхідних, так і для вихідних жетонів [1] [3].
- Команда R (серпень 2024) пропонує менші витрати, вхідні жетони коштують 0,15 долара за мільйон, а виведені жетони - 0,60 долара за мільйон [1] [4].

Відкритий код та спільнота:
-DeepSeek-R1-це відкрите код, що дозволяє вдосконалити та модифікації, орієнтовані на громаду. Ця відкритість може призвести до більш прозорих можливостей розвитку та налаштування [1] [5].
- Команда R (серпень 2024) не є відкритим кодом, обмежує участь громади до її розвитку та налаштування [1].

Швидка чутливість:
-DeepSeek-R1 чутливий до підказок, при цьому кілька пострілів спонукають, що часто погіршують його продуктивність. Рекомендується використовувати нульові підказки з чіткими інструкціями для оптимальних результатів [2].
- Не існує конкретної згадки про швидку чутливість до команди R (серпень 2024) у наявній інформації.

Підсумовуючи це, хоча обидві моделі мають сильні можливості міркувань, DeepSeek-R1 перевершує певні орієнтири та пропонує гнучкість з відкритим кодом, але з більшою ціною. Команда R (серпень 2024) є більш економічною та забезпечує конкурентоспроможність у конкретних областях, таких як генерація коду.

Цитати:
[1] https://docsbot.ai/models/compare/command-r-08-2024/deepseek-r1
[2] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[3] https://docsbot.ai/models/compare/deepseek-r1/command-r-08-2024
[4] https://artificialanalysis.ai/models/command-r
[5] https://blog.promptlayer.com/deepseek-r1-vs-o1/
[6] https://artificialanalysis.ai/models
[7] https://artificialanalysis.ai/models/command-r-03-2024
[8] https://explodingtopics.com/blog/list-of-llms

Які основні відмінності у виконанні між DeepSeek-R1 та командою Коуе (серпень 2024)