При сравнении производительности DeepSeek-R1 и GPT-4O-0513 на эталоне CodeForces появились несколько ключевых различий:
1. Рейтинг Codeforces: DeepSeek-R1 достигает рейтинга кода отдела 2029 года, что значительно выше, чем рейтинг GPT-4o-0513 759. Это указывает на то, что DeepSeek-R1 выполняет гораздо лучше в конкурентных задачах кодирования, демонстрируя сильные алгоритмические причины и способность кодирования [2].
2. Codeforces Процентиль: Deepseek-R1 балет процентиль 96,3%, отражая его высокое положение среди участников. Напротив, GPT-4o-0513 достигает только процентиля 23,6%, подчеркивая значительный разрыв в их относительных уровнях эффективности [2] [5].
3. Общая производительность: более высокий рейтинг и процентиль DeepSeek-R1 предполагают, что он более искусен в решении сложных проблем кодирования и адаптации к конкурентной среде кода. GPT-4O-0513, хотя и способный, не соответствует уровню владения DeepSeek-R1 в этой области.
4. Стоимость и эффективность: GPT-4O отмечается, что будет примерно в 4,6 раза дороже, чем DeepSeek-R1 для входных и выходных токенов, что может быть существенным фактором для пользователей, приоритетных затрат [3].
Таким образом, DeepSeek-R1 превосходит GPT-4O-0513 на эталоне CodeForces с значительным отрывом, как с точки зрения рейтинга, так и с процентиля. Это делает DeepSeek-R1 более эффективным выбором для задач, требующих сильных навыков кодирования и алгоритмических рассуждений.
Цитаты:
[1] https://ithy.com/article/openai-o1-vs-o3-benchmark-analysis-zy5f3bwj
[2] https://blog.getbind.co/2025/01/23/deepseek-r1-vs-gpt-o1-vs-claude-3-5-sonnet-hich-is-best-for-coding/
[3] https://docsbot.ai/models/compare/deepseek-r1/gpt-4o
[4] https://www.datacamp.com/blog/deepseek-r1
[5] https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-1.5b
[6] https://www.reddit.com/r/localllama/comments/1hr56e3/notes_on_deepseek_v3_is_it_truly_better_than/
[7] https://codeforces.com/blog/entry/133874
[8] https://www.reddit.com/r/localllama/comments/1em4nr5/the_new_gpt4o20240806_scores_the_same_as_original/