Grok 3, diluncurkan oleh Elon Musk's Xai, dirancang untuk bersaing dengan model AI lain seperti Openai's GPT-4O dan Google Gemini [3] [4]. XAI mengklaim Grok 3 adalah "AI paling pintar di bumi" [1].
Grok 3 versus GPT-4O:
* Tolok ukur: Grok 3 telah menunjukkan kinerja superior pada beberapa tolok ukur dibandingkan dengan GPT-4O [1] [4]. Ini termasuk matematika (AIME 24), sains (GPQA), dan coding (LCB OCT-FEB) [1]. Grok 3 mencetak 52 dalam matematika, 75 dalam sains, dan 57 dalam pengkodean, mengungguli GPT-4O di bidang ini [1] [4].
* Pemahaman Bahasa: Grok 3 mencapai akurasi 94,2% dalam tes pemahaman bahasa, sedikit melampaui 92,8% chatgpt [2].
* Pengkodean: Grok 3 dilaporkan 1.2x lebih cepat dari chatgpt dalam kecepatan pembuatan kode, dengan waktu respons rata -rata 0,8 detik [2].
* Skor Arena: Versi awal Grok 3, yang disebut sebagai "cokelat," adalah AI pertama yang melebihi skor 1400 di LMSys Chatbot Arena, mengungguli GPT-4O [4].
* Penalaran dan data real-time: Grok 3 menunjukkan kekuatan dalam penalaran matematika, tugas pengkodean, analisis data waktu-nyata, dan diskusi peristiwa terkini [2].
* Pelatihan: Grok 3 dilatih menggunakan data real-time dari X (sebelumnya Twitter), memberikannya informasi terkini [2]. Itu dilatih pada supercluster Colossus Xai, dilengkapi dengan 100.000 GPU [2].
Grok 3 versus Gemini:
* Tolok ukur: Grok 3 telah mengungguli Google Deepmind Gemini-2 Pro pada berbagai tolok ukur [1].
* Chatbot Arena (LMSYS): Versi awal Grok 3 mengungguli model utama seperti Gemini-12.0 Flash Thinking di arena chatbot [1].
* Matematika (AIME 24): Pada matematika (AIME 24) Benchmark, Grok 3 mencetak 52, sedangkan Gemini-2 Pro mencetak 39 [4].
* Sains (GPQA): Dalam Sains (GPQA), Grok 3 mencetak 75, mengungguli Gemini-2 Pro, yang mencetak 65 [4].
[1] https://www.outlookbusiness.com/start-v/news/elon-musk-uveils-grok-3-how-it-performs-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-catgpt-a-head-to-head-comparison
[3.
[4] https://felloai.com/2025/02/xais-grok-3-is-here-and-it-might-te-the-smartest-ai-on-earth/
[5] https://www.youtube.com/watch?v=wxqhhcgnbzs
[6] https://www.gurufocus.com/news/2701835/musks-xai-uveils-grok-3-says-it-beats-openais-gpt4o-on-key-benchmarks?
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_or_llama_compare_to_gpt_or/
[8] https://www.digitaltrends.com/computing/xai-grok-3-ai-model-think-deep-search-gemini-chatgpt-competition/
[9] https://blog.getbind.co/2025/02/18/grok-3-ratbot-vs-catgpt-is-grok-better-than-datgpt/