Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hvordan sammenlignes Grok 3's præstation med GPT-4O og Gemini


Hvordan sammenlignes Grok 3's præstation med GPT-4O og Gemini


Grok 3, lanceret af Elon Musks Xai, er designet til at konkurrere med andre AI-modeller som Openai's GPT-4O og Googles Gemini [3] [4]. Xai hævder Grok 3 er den "smarteste AI på jorden" [1].

Grok 3 versus GPT-4O:
* Benchmarks: Grok 3 har vist overlegen ydeevne på flere benchmarks sammenlignet med GPT-4O [1] [4]. Disse inkluderer matematik (AIMEâ 24), videnskab (GPQA) og kodning (LCB oktober-feb) [1]. Grok 3 scorede 52 i matematik, 75 i videnskab og 57 i kodning, der overgik GPT-4O i disse områder [1] [4].
* Sprogforståelse: GROK 3 opnåede 94,2% nøjagtighed i sprogforståelsestest og overgår let Chatgpts 92,8% [2].
* Kodning: Grok 3 er angiveligt 1,2x hurtigere end chatgpt i kodegenereringshastighed med en gennemsnitlig responstid på 0,8 sekunder [2].
* Arena Score: En tidlig version af Grok 3, benævnt "Chocolate", var den første AI, der overskred en score på 1400 i LMSYS Chatbot Arena, der overgår GPT-4O [4].
* Ræsonnement og realtidsdata: Grok 3 viser styrke i matematisk ræsonnement, kodningsopgaver, dataanalyse i realtid og aktuelle begivenhedsdiskussioner [2].
* Træning: Grok 3 er trænet ved hjælp af realtidsdata fra X (tidligere Twitter), hvilket giver dem ajourført information [2]. Det blev trænet på Xai's Colossus Supercluster, udstyret med 100.000 GPU'er [2].

Grok 3 versus Gemini:

* Benchmarks: Grok 3 har overgået Google Deepmind's Gemini-2 Pro på forskellige benchmarks [1].
* Chatbot Arena (LMSYS): Den tidlige version af Grok 3 overgik større modeller som Gemini-2.0 Flash Thinking på Chatbot Arena [1].
* MATH (AIMEâ 24): På matematikken (AIMEâ 24) benchmark scorede Grok 3 52, mens Gemini-2 Pro scorede 39 [4].
* Videnskab (GPQA): I Science (GPQA) scorede Grok 3 75, og overgik Gemini-2 Pro, der scorede 65 [4].

Citater:
)
)
)
)
[5] https://www.youtube.com/watch?v=wxqhhcgnbzs
)
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_or_llama_compare_to_gpt_or/
)
)