GROK 3 je pokazal močno zmogljivost pri kodiranju merila, ki je presegel OpenAI-jev GPT-4O [4] [7]. Pri kodirajočih ocenah, kot je LCB OCT-FEB, je GROK 3 dosegel 57, Grok 3 Mini pa 41, oba pa je presegla modele Gemini, Deepseek, Claude in GPT [1]. Neodvisni testi kažejo tudi na 15 -odstotno izboljšanje pri reševanju kompleksnih izzivov programiranja [2].
Grok 3 izstopa tudi s svojo hitrostjo, ki deluje 1,2 -krat hitreje kot chatgpt, s povprečnim odzivnim časom 0,8 sekunde [2]. Razvijalci programske opreme so poročali o 30 -odstotnih hitrejših odpravljanju napak pri uporabi funkcij analize kode GROK 3, njegova sposobnost razlage zapletenih algoritmov pa je izboljšala izmenjavo znanja v tehnoloških skupnostih [2].
Navedbe:[1] https://www.outlookbusiness.com/start-p/news/elon-musk-unveils-grok-3-how-it-performs-against-penais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grob-3-vs-chatgpt-aad-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-a-game-changer-in-aa-performance-and-capabilnosti
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-grok-3-is-better-han-wapped-how-to-thri-thre-it-for-free-before-you-subscribe/
[7] https://www.chaincatcher.com/sl/article/2168125
[8] https://community.openai.com/t/gpt4-Coparison-to-anthropic-opus-on-wenchmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grob_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grob-3
[11] https://aider.chat/docs/Benchmarks-0125.html