GROK 3 heeft sterke prestaties aangetoond in coderende benchmarks, beter dan Openai's GPT-4O [4] [7]. In coderende evaluaties zoals LCB OCT-FEB, scoorde GROK 3 57, terwijl Grok 3 Mini 41 scoorde, beide overtreffen Gemini, Deepseek, Claude en GPT-modellen [1]. Onafhankelijke tests duiden ook op een verbetering van 15% bij het oplossen van complexe programmeeruitdagingen [2].
GROK 3 valt ook op met zijn snelheid en werkt 1,2 keer sneller dan chatgpt, met een gemiddelde responstijd van 0,8 seconden [2]. Softwareontwikkelaars hebben een 30% snellere foutopsporingssessies gerapporteerd bij het gebruik van de functies van de codeanalyse van GROK 3 en het vermogen om complexe algoritmen uit te leggen, heeft verbeterde kennisuitwisseling in technische gemeenschappen [2].
Citaten:[1] https://www.outlookbusiness.com/start-up/news/elon-musk-unveils-grok-3-how-it-performs-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-game-changer-in-ai-performance-and-capabilities
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-grok-3-is-better-than-expected-how-to-try-it-for-fefore-before-you-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparision-to-anthropic-opus-on-bankmarks/726147
[9] https://www.reddit.com/r/openai/comment
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html