Grok 3 đã thể hiện hiệu suất mạnh mẽ trong các điểm chuẩn mã hóa, vượt trội so với GPT-4O của Openai [4] [7]. Trong các đánh giá mã hóa như LCB OCT-FEB, Grok 3 đã ghi được 57, trong khi Grok 3 mini ghi được 41, cả hai đều vượt qua các mô hình Gemini, Deepseek, Claude và GPT [1]. Các thử nghiệm độc lập cũng chỉ ra sự cải thiện 15% trong việc giải quyết các thách thức lập trình phức tạp [2].
Grok 3 cũng nổi bật với tốc độ của nó, hoạt động nhanh hơn 1,2 lần so với TATGPT, với thời gian phản hồi trung bình là 0,8 giây [2]. Các nhà phát triển phần mềm đã báo cáo các phiên gỡ lỗi nhanh hơn 30% khi sử dụng các tính năng phân tích mã của Grok 3 và khả năng giải thích các thuật toán phức tạp đã cải thiện chia sẻ kiến thức trong các cộng đồng công nghệ [2].
Trích dẫn:[1] https://www.outlookbusiness.com/start-up/news/elon-musk-unveils-grok-3-how-it-performs-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-a-game-changer-in-ai-performance-and-capabilities
[5] https://news.ycombinator.com/item?id=38184426
.
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-anthropic-opus-on-benchmarks/726147
[9] https://www.reddit.com/R/OPENAI
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmark-0125.html