Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon ما هي المعايير المحددة التي تم اختبار Grok 3 و GPT-4O


ما هي المعايير المحددة التي تم اختبار Grok 3 و GPT-4O


تم اختبار Grok 3 و GPT-4O على عدة معايير لتقييم أدائها عبر مختلف المجالات:

- الرياضيات: حققت Grok 3 درجة قدرها 93.3 ٪ في امتحان الرياضيات الدعائية الأمريكية 2025 (AIME) ، في حين أن أداء GPT-4O في هذا المجال لا يتم تسليط الضوء عليه بشكل صريح في البيانات المتاحة. ومع ذلك ، لوحظ أداء Grok 3 في Aime 2024 على أنه أعلى بكثير من الأداء العام لـ GPT-4O في المهام المتعلقة بالرياضيات [1] [3] [5].

-العلم والمنطق: سجل Grok 3 84.6 ٪ في اختبار GPQA (تفكير الخبراء على مستوى الدراسات العليا) ، وعرض قوته في المعرفة العلمية على مستوى الدراسات العليا. أداء GPT-4O في مهام التفكير المماثلة أقل بشكل عام مقارنة بـ Grok 3 [1] [3] [6].

- الترميز: حقق Grok 3 79.4 ٪ على LiveCodeBench ، يتفوق على GPT-4O في مهام توليد الكود. لم يتم تفصيل درجة GPT-4O على LiveCodeBench ، ولكن Grok 3 تتفوق عمومًا في معايير الترميز [1] [3] [5].

- المعرفة العامة: سجل Grok 3 79.9 ٪ على MMLU-Pro ، والذي يختبر المعرفة الواسعة عبر مواضيع متعددة. سجل GPT-4O 72.6 ٪ على نفس المعيار ، مما يشير إلى أداء Grok 3 الأقوى في مهام المعرفة العامة [3].

- فهم متعدد الوسائط: إمكانيات Grok 3 أظهرت في المهام متعددة الوسائط مثل MMMU (فهم نموذج المهام متعددة الوسائط) ، على الرغم من أن مقارنات محددة مع GPT-4O في هذا المجال محدودة [1] [3].

بشكل عام ، يميل Grok 3 إلى التفوق على GPT-4O في المهام المتخصصة مثل الرياضيات والعلوم والترميز ، في حين أن GPT-4O قد يكون أكثر تنوعًا في التطبيقات المتعددة للأغراض العامة [2] [5] [6].

الاستشهادات:
[1] https://www.leanware.co/Insights/grok-3-vs-gpt-models-comparison
[2] https://www.datacamp.com/blog/grok-3
[3] https://x.ai/blog/grok-3
[4] https://www.outlookbusiness.com/start up/news/elon-musk-unveils-grok-3-how-it-performs-against-openais-gpt-4o-deepseek
[5] https://www.helicone.ai/blog/grok-3-benchmark-comparison
[6] https://felloai.com/2025/02/grok-3-vs-chatgpt-vs-deepseek-vs-claude-vs-gemini-
[7] https://lifehacker.com/tech/i-tested-grok-3-and-not-worth-the-price-hike
[8] https://writesonic.com/blog/grok-3-vs-chatgpt