AIME 2024 Benchmark'da Deepseek-R1 vs GPT-4O: Performans Karşılaştırması

Deepseek-R1'in AIME 2024 kıyaslama performansı GPT-4O-0513 gibi diğer modellerle karşılaştırılıyor

Deepseek-R1'in AIME 2024 ölçütü üzerindeki performansı,%79.8 puan aldığı için,%79.2'ye ulaşan Openai O1-1217'nin biraz önünde kaydettiği için dikkat çekicidir [1]. Bununla birlikte, Deepseek-R1 ve GPT-4O-0513 arasında özellikle AIME 2024 ölçütünde sınırlı doğrudan karşılaştırma mevcuttur.

GPT-4O modelleri genellikle çeşitli görevlerdeki sağlam performanslarıyla bilinir, ancak AIME 2024'teki GPT-4O-0513 için spesifik sonuçlar mevcut bilgilerde ayrıntılı değildir. GPT-4O modelleri tipik olarak dil anlayışı ve üretim görevlerinde güçlüdür, ancak AIME gibi özel matematiksel akıl yürütme ölçütleri üzerindeki performansları, Deepseek-R1 gibi bu tür görevler için özel olarak optimize edilmiş modellere kıyasla değişebilir.

Deepseek-R1'in AIME 2024'teki güçlü performansı, akıl yürütme yeteneklerini geliştirmek için büyük ölçekli takviye öğrenimini içeren mimarisine atfedilebilir. Bu yaklaşım, gelişmiş çok adımlı matematiksel akıl yürütme gerektiren görevlerde mükemmel olmasını sağlar [1] [3]. Buna karşılık, GPT-4O modelleri daha genelleştirilir ve matematiksel akıl yürütme görevlerinde aynı uzmanlık seviyesine sahip olmayabilir.

Genel olarak, Deepseek-R1 AIME 2024'te Openai O1-1217'ye kıyasla üstün performans gösterirken, GPT-4O-0513 ile doğrudan karşılaştırmalar mevcut verilerde açıkça sağlanmamıştır. Bununla birlikte, Deepseek-R1'in özel eğitim ve mimarisi muhtemelen matematiksel akıl yürütme ölçütlerindeki güçlü gösterisine katkıda bulunur.

Alıntılar:
[1] https://www.datacamp.com/blog/deepseek-r1
[2] https://blog.getbind.co/2025/01/23/deepseek-r1-vs-gpt-o1-vs-claude-3-5-stonnet-
[3] https://docsbot.ai/models/compare/gpt-4o-2024-05-13/deepseek-r1
[4] https://artificialanalysis.ai/models/deepseek-r1
[5] https://docsbot.ai/models/compare/deepseek-r1/gpt-4o
[6] https://llm-stats.com/models/compare/deepseek-r1-vs-gpt-4o-2024-08-06
[7] https://www.prompthub.us/blog/deepseek-1-model-overview-and-how-it-ragainst-openais-o1
[8] https://docsbot.ai/models/compare/gpt-4o/deepseek-r1