Το Grok 3 έχει επιδείξει ισχυρές επιδόσεις σε σημεία αναφοράς κωδικοποίησης, που ξεπερνά το GPT-4O της OpenAI [4] [7]. Σε κωδικοποιητικές αξιολογήσεις όπως το LCB Oct-Feb, ο Grok 3 σημείωσε 57, ενώ ο Grok 3 Mini σκόραρε 41, και τα δύο ξεπέρασε τα μοντέλα Gemini, Deepseek, Claude και GPT [1]. Οι ανεξάρτητες δοκιμές υποδεικνύουν επίσης βελτίωση 15% στην επίλυση σύνθετων προκλήσεων προγραμματισμού [2].
Το Grok 3 ξεχωρίζει επίσης με την ταχύτητά του, που λειτουργεί 1,2 φορές ταχύτερα από το ChatGPT, με μέσο χρόνο απόκρισης 0,8 δευτερολέπτων [2]. Οι προγραμματιστές λογισμικού ανέφεραν 30% ταχύτερες συνεδρίες εντοπισμού σφαλμάτων κατά τη χρήση χαρακτηριστικών ανάλυσης κώδικα Grok 3 και η ικανότητά του να εξηγεί σύνθετους αλγόριθμους έχει βελτιώσει την ανταλλαγή γνώσεων στις τεχνολογικές κοινότητες [2].
Αναφορές:[1] https://www.outlookbusiness.com/start-p/news/elon-musk-unveils-grok-3-how-it-performs-gainst-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-a-game-changer-in-ai-performance-and-capabilities
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-grok-3-is-better-than-expance-how-try-it-for-fore-fore-you-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-anthropic-opus-on-benchmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grok_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html