Grok 3 on osoittanut vahvan suorituskyvyn koodausvertailuarvoissa, ylittäen Openain GPT-4O: n [4] [7]. Koodausarvioinneissa, kuten LCB OCT-helm-helikassa, Grok 3 sai 57, kun taas Grok 3 Mini sai 41, molemmat ylittivät Gemini-, Deepseek-, Claude- ja GPT-mallit [1]. Riippumattomat testit osoittavat myös 15%: n parannuksen monimutkaisten ohjelmointihaasteiden ratkaisemisessa [2].
Grok 3 erottuu myös nopeudellaan, toimiessaan 1,2 kertaa nopeammin kuin chatgpt, keskimääräinen vasteaika 0,8 sekuntia [2]. Ohjelmistokehittäjät ovat ilmoittaneet 30% nopeammista virheenkorjausistunnoista käytettäessä Grok 3: n koodianalyysiominaisuuksia, ja sen kyky selittää monimutkaisia algoritmeja on parantanut tiedon jakamista teknologiayhteisöissä [2].
Viittaukset:.
.
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
.
[5] https://news.ycombinator.com/item?id=38184426
.
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-anthropic-opus-on-benchmarks/726147
[9.
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html