Grok 3: Elona Muska Xai AI modelis pārspēj GPT-4O un Dvīņus

Kā GROK 3 izrāde salīdzina ar GPT-4O un Dvīņi

GROK 3, ko uzsāka Elona Muska XAI, ir paredzēts, lai konkurētu ar citiem AI modeļiem, piemēram, Openai GPT-4O un Google Dvīņiem [3] [4]. Xai apgalvo, ka Grok 3 ir "gudrākais AI uz zemes" [1].

Grok 3 pret GPT-4O:
* Etaloni: Grok 3 ir parādījis izcilu sniegumu vairākos etalonos, salīdzinot ar GPT-4O [1] [4]. Tajos ietilpst matemātika (AIMEâ 24), zinātne (GPQA) un kodēšana (LCB oktobris-Febs) [1]. Grok 3 matemātikā ieguva 52, 75 zinātnē un 57 kodēšanā, pārspējot GPT-4O šajās teritorijās [1] [4].
* Valodas izpratne: GROK 3 sasniedza 94,2% precizitāti valodas izpratnes testos, nedaudz pārspējot Chatgpt's 92,8% [2].
* Kodēšana: GROK 3 ir ziņots, ka koda ģenerēšanas ātrumā ir 1,2x ātrāks nekā Chatgpt, ar vidējo reakcijas laiku 0,8 sekundes [2].
* Arena rezultāts: GROK 3 agrīnā versija, ko dēvē par “šokolādi”, bija pirmā AI, kas LMSYS tērzēšanas arēnā pārsniedza rezultātu 1400, pārspējot GPT-4O [4].
* Argumentācija un reālā laika dati: Grok 3 parāda stiprumu matemātiskajā spriešanā, kodēšanas uzdevumos, reālā laika datu analīzē un pašreizējo notikumu diskusijās [2].
* Apmācība: Grok 3 tiek apmācīts, izmantojot reāllaika datus no X (agrāk Twitter), sniedzot tam atjauninātu informāciju [2]. Tas tika apmācīts uz XAI Colossus Supercluster, kas aprīkots ar 100 000 GPU [2].

Grok 3 pret Dvīņi:

* Benchmarks: Grok 3 ir pārspējis Google Deepmind Gemini-2 Pro dažādos etalonos [1].
* Chatbot arēna (LMSYS): Grok 3 agrīnā versija pārspēja galvenos modeļus, piemēram, Gemini-2.0 Flash domāšanu tērzēšanas arēnā [1].
* Matemātika (AIMEâ 24): par matemātikas (AIMEâ 24) etalonu, Grok 3 ieguva 52, bet Gemini-2 Pro ieguva 39 [4].
* Zinātne (GPQA): Science (GPQA), Grok 3 ieguva 75, pārspēja Gemini-2 Pro, kas ieguva 65 [4].

Atsauces:
[1.]
[2] https://9meters.com/technology/ai/grok-3-vs-chatgpt-a-head-to-comparison
[3.]
.
[5] https://www.youtube.com/watch?v=wxqhhcgnbzs
.
[7] https://www.reddit.com/r/singularity/comments/1h8ox94/how_does_gemini_grok_or_llama_compare_to_gpt_or/
[8] https://www.digitaltrends.com/computing/xai-grok-3-ai-model-think-deep-search-gemini-chatgpt-competition/
[9] https://blog.getbind.co/2025/02/18/grok-3-chatbot-vs-chatgpt-is-grok-better-than-chatgpt/