Grok 3, ki ga je predstavil Xai Elona Muska, je zasnovan tako, da tekmuje z drugimi AI modeli, kot sta OpenAI-jev GPT-4O in Googlovi Dvojčki [3] [4]. Xai trdi, da je Grok 3 "najpametnejši AI na Zemlji" [1].
GROK 3 proti GPT-4O:
* Merila: GROK 3 je pokazal vrhunsko zmogljivost na več referenčnih vrednostih v primerjavi z GPT-4O [1] [4]. Sem spadajo matematika (Aimeâ 24), znanost (GPQA) in kodiranje (LCB OCT-FEB) [1]. Grok 3 je dosegel 52 v matematiki, 75 v znanosti in 57 pri kodiranju, kar je presegalo GPT-4O na teh območjih [1] [4].
* Razumevanje jezika: Grok 3 je dosegel 94,2% natančnost v testih za razumevanje jezika, kar je rahlo presegalo 92,8% Chatgpta [2].
* Kodiranje: Grok 3 naj bi bil 1,2x hitreje kot chatgpt v hitrosti ustvarjanja kode, povprečni odzivni čas 0,8 sekunde [2].
* Arena Rezultat: Zgodnja različica Groka 3, imenovana "čokolada", je bila prva AI, ki je presegla oceno 1400 v Areni LMSYS Chatbot, ki je presegla GPT-4O [4].
* Obrazložitev in podatki v realnem času: GROK 3 prikazuje moč pri matematičnem sklepanju, kodirajočih nalogah, analizi podatkov v realnem času in trenutnih razpravah o dogodkih [2].
* Usposabljanje: Grok 3 je usposobljen s pomočjo podatkov v realnem času iz X (prej Twitterja), ki mu daje posodobljene informacije [2]. Izobražena je bila na Xai's Colossus Supercluster, opremljena s 100.000 GPU [2].
GROK 3 proti Blizancem:
* Merila: Grok 3 je na različnih referenčnih vrednostih presegel Google Deepmind's Gemini-2 Pro [1].
* Chatbot Arena (LMSYS): Zgodnja različica Groka 3 je presegla glavne modele, kot je GEMINI-2.0 Flash Thinking na Areni Chatbot [1].
* Matematika (Aimeâ 24): Na referenčnem merilu matematike (Aimeâ 24) je Grok 3 dosegel 52, medtem ko je Gemini-2 Pro dosegel 39 [4].
* Znanost (GPQA): V Science (GPQA) je Grok 3 dosegel 75, kar je presegalo Gemini-2 Pro, ki je dosegel 65 [4].
[1] https://www.outlookbusiness.com/start-p/news/elon-musk-unveils-grok-3-how-it-performs-against-penais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grob-3-vs-chatgpt-aad-to-head-comparison
[3] https://opentools.ai/news/elon-musks-xai-unveils-grok-3-a-game-changer-in-aa-performance-and-capabilnosti
[4] https://felloai.com/2025/02/xais-grok-3-is-here-and-it-might-be-the-smartest-ai-on-earth/
[5] https://www.youtube.com/watch?v=WXQHHCGNBZS
[6] https://www.gurufocus.com/news/2701835/Musks-xai-unveils-grok-3-says-it-beats-penais-gpt4o-on-y-benchmarks?
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_orl_llama_compare_to_gpt_or/
[8] https://www.digitaltrends.com/computing/xai-grok-3-ai-model-think-ep-search-gemini-chatgpt-competition/
[9] https://blog.getbind.co/2025/02/18/GROK-3-chatbot-vs-chatgpt-is-Grook-better-than-chatgpt/