Deepseek-R1 vs GPT-4o-0513: Perbandingan Kinerja pada Benchmark Codeforces

Apa perbedaan utama dalam kinerja antara Deepseek-R1 dan GPT-4o-0513 pada tolok ukur codeforces

Saat membandingkan kinerja Deepseek-R1 dan GPT-4O-0513 pada tolok ukur codeforces, beberapa perbedaan utama muncul:

1. Peringkat Codeforces: Deepseek-R1 mencapai peringkat Codeforces tahun 2029, yang secara signifikan lebih tinggi dari GPT-4o-0513's 759. Ini menunjukkan bahwa Deepseek-R1 berkinerja jauh lebih baik dalam tugas pengkodean kompetitif, menampilkan Algorithmic Algorithmic yang lebih kuat dan kemampuan pengkodean [2] [2] [2] [2].

2. Codeforces Persentile: Deepseek-R1 mencetak persentil 96,3%, mencerminkan kedudukannya yang tinggi di antara peserta manusia. Sebaliknya, GPT-4O-0513 hanya mencapai persentil 23,6%, menyoroti kesenjangan substansial dalam tingkat kinerja relatif mereka [2] [5].

3. Kinerja Keseluruhan: Peringkat yang lebih tinggi dan persentil Deepseek-R1 menunjukkan bahwa lebih mahir dalam menyelesaikan tantangan pengkodean yang kompleks dan beradaptasi dengan lingkungan kompetitif kodeforces. GPT-4O-0513, walaupun mampu, tidak cocok dengan tingkat kemahiran Deepseek-R1 dalam domain ini.

4. Biaya dan Efisiensi: GPT-4O tercatat sekitar 4,6 kali lebih mahal daripada Deepseek-R1 untuk token input dan output, yang bisa menjadi faktor signifikan bagi pengguna yang memprioritaskan efisiensi biaya [3].

Singkatnya, Deepseek-R1 mengungguli GPT-4o-0513 pada tolok ukur codeforces dengan margin yang cukup besar, baik dalam hal peringkat maupun persentil. Ini membuat Deepseek-R1 menjadi pilihan yang lebih efektif untuk tugas yang membutuhkan pengkodean yang kuat dan keterampilan penalaran algoritmik.

Kutipan:
[1] https://ithy.com/article/openai-o1-vs-o3-benchmark-analysis-zy5f3bwj
[2] https://blog.getbind.co/2025/01/23/deepseek-r1-vs-gpt-o1-vs-claude-3-5-sonnet-which-is-best-for-coding/
[3] https://docsbot.ai/models/compare/deepseek-r1/gpt-4o
[4] https://www.datacamp.com/blog/deepseek-r1
[5] https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-1.5b
[6] https://www.reddit.com/r/localllama/comments/1hr56e3/notes_on_deepseek_v3_is_it_truly_better_than/
[7] https://codeforces.com/blog/entry/133874
[8] https://www.reddit.com/r/localllama/comments/1em4nr5/the_new_gpt4o20240806_scores_the_same_as_original/