Grok 3 แสดงให้เห็นถึงความเหนือกว่าของ GPT-4O ในงานต้นกำเนิดผ่านเกณฑ์มาตรฐานที่สำคัญหลายประการ:
1. คณิตศาสตร์ (AIME 2025): Grok 3 ได้คะแนน 93.3% ซึ่งมีประสิทธิภาพสูงกว่าคะแนน GPT-4O อย่างมีนัยสำคัญ 79% ในงานการใช้เหตุผลทางคณิตศาสตร์ [1] [3] ประสิทธิภาพนี้สอดคล้องกับความสามารถของ Grok 3 ในการแก้ปัญหาทางคณิตศาสตร์ที่ซับซ้อนอย่างมีประสิทธิภาพ
2. วิทยาศาสตร์ (GPQA): Grok 3 คะแนน 84.6% สำหรับการให้เหตุผลจากผู้เชี่ยวชาญระดับบัณฑิตศึกษาซึ่งเหนือกว่าคะแนน GPT-4O ของ 78% ในการแก้ปัญหาทางวิทยาศาสตร์ [1] [3] สิ่งนี้บ่งชี้ถึงความสามารถขั้นสูงของ Grok 3 ในการวิเคราะห์ข้อมูลทางวิทยาศาสตร์และให้คำตอบที่แม่นยำ
3. การเข้ารหัส (LiveCodeBench): Grok 3 เก่งด้วยคะแนน 79.4%, คะแนนสูงกว่าคะแนน GPT-4O ที่ 72.9% ในการสร้างรหัสและงานการเขียนโปรแกรม [1] [3] สิ่งนี้แสดงให้เห็นถึงความสามารถของ Grok 3 ในการสร้างรหัสที่สะอาดและใช้งานได้อย่างมีประสิทธิภาพ
มาตรฐานเหล่านี้เน้นประสิทธิภาพที่เหนือกว่าของ Grok 3 ในสาขา STEM ทำให้เป็นตัวเลือกที่ต้องการสำหรับมืออาชีพในวิชาคณิตศาสตร์วิทยาศาสตร์และการเขียนโปรแกรม นอกจากนี้โหมดคิดของ Grok 3 ยังให้ความโปร่งใสในกระบวนการให้เหตุผลซึ่งเป็นประโยชน์อย่างยิ่งสำหรับแอปพลิเคชัน STEM [1] [3]
การอ้างอิง:[1] https://writesonic.com/blog/grok-3-vs-chatgpt
[2] https://www.datacamp.com/blog/grok-3
[3] https://www.leanware.co/insights/grok-3-vs-gpt-models-comparison
[4] https://www.helicone.ai/blog/grok-3-benchmark-comparison
[5] https://www.nitromediagroup.com/grok-3-elon-musk-xai-vs-chatgpt-deep-seek/
[6] https://twitter.com/khandnanpathan/status/1892435136362279007
[7] https://x.ai/blog/grok-3
[8] https://opencv.org/blog/grok-3/
[9] https://channel8.com/english/31979