Grok 3 prokázal silný výkon při kódování benchmarků a překonal OpenAI GPT-4o [4] [7]. V hodnocení kódování, jako je LCB OCT-FEB, Grok 3 skóroval 57, zatímco Grok 3 Mini skóroval 41, oba překonali Gemini, Deepseek, Claude a GPT [1]. Nezávislé testy také naznačují 15% zlepšení řešení komplexních programovacích výzev [2].
Grok 3 také vyniká s rychlostí, pracuje 1,2krát rychleji než chatgpt, s průměrnou dobou odezvy 0,8 sekundy [2]. Vývojáři softwaru vykázali při použití funkcí analýzy kódu Grok 3 o 30% rychlejší ladicí sezení a jeho schopnost vysvětlit komplexní algoritmy zlepšila sdílení znalostí v technologických komunitách [2].
Citace:[1] https://www.outlookbusiness.com/start-ph/news/elon-musk-onveils-rok-3-how-it-forms-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt---head-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-muscks-xai-unveils-grok-3-a-game-changer-in-i-ai-performance and-copabibility
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-rok-3-is-better-than-otexted-to-try-f-free-on-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-annthropic-opus-on-bchnmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grok_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/Benchmarks-0125.html