O GROK 3 demonstrou forte desempenho em benchmarks de codificação, superando o GPT-4O do OpenAI [4] [7]. Em avaliações de codificação como LCB OCT-FEB, GROK 3 marcou 57, enquanto Grok 3 Mini marcou 41, ambos superando os modelos Gêmeos, Deepseek, Claude e GPT [1]. Testes independentes também indicam uma melhoria de 15% na solução de desafios de programação complexos [2].
O GROK 3 também se destaca com sua velocidade, operando 1,2 vezes mais rápido que o ChatGPT, com um tempo médio de resposta de 0,8 segundos [2]. Os desenvolvedores de software relataram uma sessões de depuração 30% mais rápidas ao usar os recursos de análise de código da GROK 3, e sua capacidade de explicar algoritmos complexos melhorou o compartilhamento de conhecimento nas comunidades de tecnologia [2].
Citações:[1] https://www.outlookbusiness.com/start-up/news/elon-musk-unveils-plok-3-how-it-performs-against-openais-gpt-4o-Deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-weate-d-cabeça
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-gok-3-a- game-changer-in-ai-performance-and-capabilities
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-prok-3-is-better-than-epouted-ow-try-it-for-free-forfore-you-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-antrópica-pus-on-benchmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grok_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html