„Grok 3“: Elono Musko „Xai AI“ modelis pralenkia GPT-4o ir Dvynius

Kaip „Grok 3“ pasirodymas palyginamas su GPT-4o ir Dvyniais

„Grok 3“, kurį paleido „Elon Musk's Xai“, yra skirtas konkuruoti su kitais AI modeliais, tokiais kaip „Openai“ GPT-4O ir „Google's Gemini“ [3] [4]. Xai teigia, kad „Grok 3“ yra „protingiausia AI žemėje“ [1].

„Grok 3“, palyginti su GPT-4o:
* Enchmarks: GROK 3 pademonstravo aukštesnius rezultatus keliuose etalonuose, palyginti su GPT-4o [1] [4]. Tai apima matematiką (Aime 24), mokslą (GPQA) ir kodavimą (LCB Oct-Feb) [1]. „Grok 3“ surinko 52 matematiką, 75 moksle ir 57 kodavimo metu, pralenkdamas GPT-4o šiose srityse [1] [4].
* Kalbos supratimas: „Grok 3“ pasiekė 94,2% tikslumą kalbos supratimo testų tikslumu, šiek tiek pranokdamas „ChatGpt“ 92,8% [2].
* Kodavimas: „Grok 3“ pranešama 1,2x greičiau nei „ChatGpt“ kodo generavimo greičiu, o vidutinis atsako laikas yra 0,8 sekundės [2].
* Arenos rezultatas: ankstyvoji „Grok 3“ versija, vadinama „šokoladu“, buvo pirmoji AI, viršijanti 1400 balą „LMSys Chatbot“ arenoje, pralenkdamas GPT-4o [4].
* Priežiūros ir realaus laiko duomenys: 3 GROK rodo matematinio samprotavimo stiprumą, kodavimo užduotis, realaus laiko duomenų analizę ir dabartines įvykių diskusijas [2].
* Treniruotės: „Grok 3“ mokomas naudojant realaus laiko duomenis iš X (buvusi „Twitter“), pateikiant jį naujausią informaciją [2]. Jis buvo apmokytas „Xai“ „Colossus“ superklasteryje, kuriame įrengta 100 000 GPU [2].

Grok 3, palyginti su Dvyniais:

* Enchmarks: „GROK 3“ įvairiuose etalonuose aplenkė „Google DeepMind“ „Gemini-2 Pro“ [1].
* „ChatBot“ arena (LMSYS): ankstyvoji „Grok 3“ versija pralenkė pagrindinius modelius, tokius kaip „Gemini-22.0“ „Flash“ mąstymas „Chatbot“ arenoje [1].
* Matematika (Aime 24): Matematikos (Aime 24) etalone, „Grok 3“ pelnė 52, o „Gemini-2 Pro“ surinko 39 [4].
* Mokslas (GPQA): „Science“ (GPQA), „GROK 3“ surinko 75, pralenkdamas „Gemini-2 Pro“, kuris surinko 65 [4].

Citatos:
[1] https://www.outlookbusiness.com/start-ku-ution/news/elon-Musk-unveils-grok-3-how-it-perform-against-openais-gpt-4o-deepseek
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-head-head-comparion
[3] https://opentools.ai/news/elon-Musks-xai-unveils-grok-3-a-game-changer-in-ai-erformance-and-capability
[4] https://felloai.com/2025/02/xais-grok-3-is-here-and-it-might-be-the-smartest-ai-on-egrth/
[5] https://www.youtube.com/watch?v=WXQHHCGNBZS
[6] https://www.gurufocus.com/news/2701835/musks-xai-unveils-grok-3-says- it-peats-openais-gpt4o-on-key-benchmarks?r=caf6fe0Db70db70d93603Da5461e60141
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_or_llama_compare_to_gpt_or/
[8] https://www.digitaltrends.com/computing/xai-grok-3-ai-model---finch-search-search-gemini-chatgpt-compettition/
[9] https://blog.getbind.co/2025/02/18/grok-3-chatbot-vs-chatgpt-is-grok-better than-chatgpt/