Grok 3 a demonstrat performanțe puternice în codificarea de referință, depășind GPT-4O OpenAI [4] [7]. În evaluări de codificare precum LCB OCT-FEB, Grok 3 a marcat 57, în timp ce Grok 3 Mini a marcat 41, ambele depășind modelele Gemini, Deepseek, Claude și GPT [1]. Testele independente indică, de asemenea, o îmbunătățire de 15% a rezolvării provocărilor complexe de programare [2].
Grok 3 se remarcă, de asemenea, cu viteza sa, funcționând de 1,2 ori mai rapid decât ChatGPT, cu un timp mediu de răspuns de 0,8 secunde [2]. Dezvoltatorii de software au raportat o sesiuni de depanare mai rapide cu 30% atunci când folosesc caracteristicile de analiză a codului Grok 3, iar capacitatea sa de a explica algoritmi complexi a îmbunătățit schimbarea cunoștințelor în comunitățile tehnologice [2].
Citări:[1] https://www.outlookbusiness.com/start-p
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-head-compaton
[3] https://paperswithcode.com/paper/gpt-4-tehnical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-a-game-canger-in-ai-performance-și-capabilități
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-grok-3-is-better-than-expected-wow-to-tr-it-for-fre-before-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-antropic-opus-on-benchmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grok_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html