Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Bagaimana kinerja Grok 3 dalam pengkodean tolok ukur dibandingkan dengan GPT-4O


Bagaimana kinerja Grok 3 dalam pengkodean tolok ukur dibandingkan dengan GPT-4O


Grok 3 telah menunjukkan kinerja yang kuat dalam pengkodean tolok ukur, mengungguli GPT-4O Openai [4] [7]. Dalam evaluasi pengkodean seperti LCB OCT-FEB, Grok 3 mencetak 57, sementara Grok 3 Mini mencetak 41, keduanya melampaui model Gemini, Deepseek, Claude, dan GPT [1]. Tes independen juga menunjukkan peningkatan 15% dalam menyelesaikan tantangan pemrograman kompleks [2].

Grok 3 juga menonjol dengan kecepatannya, beroperasi 1,2 kali lebih cepat dari chatgpt, dengan waktu respons rata -rata 0,8 detik [2]. Pengembang perangkat lunak telah melaporkan sesi debugging 30% lebih cepat saat menggunakan fitur analisis kode GROK 3, dan kemampuannya untuk menjelaskan algoritma yang kompleks telah meningkatkan berbagi pengetahuan di komunitas teknologi [2].

Kutipan:
[1] https://www.outlookbusiness.com/start-v/news/elon-musk-uveils-grok-3-how-it-performs-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-catgpt-a-head-to-head-comparison
[3] https://paperswithcode.com/paper/gpt-4-technical-report-1
[4] https://opentools.ai/news/elon-musks-xai-uNveils-grok-3-a-game-changer-in-ai-performance-and-capability
[5] https://news.ycombinator.com/item?id=38184426
[6] https://www.zdnet.com/article/xais-grok-3-is-better-than-cexpected-how-t-try-it-t-for-for-fore-dub-subscribe/
[7] https://www.chaincatcher.com/en/article/2168125
[8] https://community.openai.com/t/gpt4-comparison-to-anthropic-opus-on-benchmarks/726147
[9] https://www.reddit.com/r/openai/comments/1bqdo47/grok_15_now_beats_gpt4_2023_in_humaneval_code/
[10] https://www.datacamp.com/blog/grok-3
[11] https://aider.chat/docs/benchmarks-0125.html