Grok 3: El modelo XAI AI de Elon Musk supera a GPT-4O y Géminis

¿Cómo se compara el rendimiento de Grok 3 con GPT-4O y Gemini?

Grok 3, lanzado por Elon Musk's XAI, está diseñado para competir con otros modelos de IA como GPT-4O de OpenAI y Gemini de Google [3] [4]. Xai afirma que Grok 3 es la "IA más inteligente de la Tierra" [1].

Grok 3 versus GPT-4O:
* Puntos de referencia: Grok 3 ha demostrado un rendimiento superior en varios puntos de referencia en comparación con GPT-4O [1] [4]. Estos incluyen matemáticas (AIME 24), Science (GPQA) y codificación (LCB OCT-FEB) [1]. Grok 3 obtuvo 52 en matemáticas, 75 en ciencias y 57 en codificación, superando a GPT-4O en estas áreas [1] [4].
* Comprensión del lenguaje: Grok 3 alcanzó el 94.2% de precisión en las pruebas de comprensión del lenguaje, superando ligeramente el 92.8% de ChatGPT [2].
* Codificación: Según los informes, Grok 3 es 1.2x más rápido que el chatGPT en la velocidad de generación de código, con un tiempo de respuesta promedio de 0.8 segundos [2].
* Arena Puntuación: una versión temprana de Grok 3, denominada "Chocolate", fue la primera IA en exceder una puntuación de 1400 en el LMSYS Chatbot Arena, superando a GPT-4O [4].
* Razonamiento y datos en tiempo real: Grok 3 muestra la fuerza en el razonamiento matemático, las tareas de codificación, el análisis de datos en tiempo real y las discusiones de eventos actuales [2].
* Entrenamiento: Grok 3 está capacitado utilizando datos en tiempo real de X (anteriormente Twitter), proporcionándole información actualizada [2]. Fue entrenado en el Coloso Supercluster de Xai, equipado con 100,000 GPU [2].

Grok 3 versus Géminis:

* Puntos de referencia: Grok 3 ha superado a Google Deepmind S Gemini-2 Pro en varios puntos de referencia [1].
* Chatbot Arena (LMSYS): la versión temprana de Grok 3 superó a modelos principales como Gemini-2.0 Flash pensando en el chatbot Arena [1].
* Matemáticas (AIMEâ 24): en el punto de referencia Math (Aimeâ 24), Grok 3 obtuvo 52, mientras que Gemini-2 Pro anotó 39 [4].
* Science (GPQA): en Science (GPQA), Grok 3 obtuvo 75, superando a Gemini-2 Pro, que obtuvo 65 [4].

Citas:
[1] https://www.outlookbusiness.com/start-up/news/elon-musk-unveils-crok-3-how-it-performs-gainst-openais-gpt-4o-depseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-tead-to-headead-comparison
[3] https://opentools.ai/news/elon-musks-xai-unveils grok-3-a-game-changer-in-ai-performance-and-capabilities
[4] https://felloi.com/2025/02/xais-grok-3-is-here-and-it-might-be-the-smartest-ai-on-earth/
[5] https://www.youtube.com/watch?v=WXQHCGNBZS
[6] https://www.gufocus.com/news/2701835/musks-xai-unveils-grok-3-says-it-beats-openais-gpt4o-on-key-benchmars?r=CAF6FE0E0DB70D936033DA5461E601414141414141
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_or_llama_compare_to_gpt_or/
[8] https://www.digitaltrends.com/computing/xai-grok-3-ai-model-think-deep-search-gemini-chatgpt-competition/
[9] https://blog.getbind.co/2025/02/18/grok-3-chatbot-vs-chatgpt-is grok-better-than-chatgpt/