Jak je výkon Grok 3 v matematickém uvažování ve srovnání s GPT-4o
Grok 3 ukazuje vynikající výkon v matematickém uvažování ve srovnání s GPT-4o. Na americkém invitační matematické vyšetření 2025 (AIME) dosáhl Grok 3 skóre 93,3%, což významně překonal GPT-4o, který v podobných matematických úkolech zaznamenal 79% [1] [2]. To ukazuje, že Grok 3 vyniká v komplexním matematickém řešení problémů, díky svým pokročilým schopnostem uvažování a schopnosti upřesnit řešení v průběhu času pomocí posilovacího učení [1] [5]. Naproti tomu, zatímco GPT-4o je silná při řešení problémů a kontextuálního porozumění, nevykazuje svůj proces uvažování tak explicitně jako Grok 3 [2]. Celkově poskytuje režim Think Grok 3 transparentní proces myšlení, což je obzvláště prospěšné pro profesionály a pedagogy STEM [2] [3].
Citace:
[1] https://x.ai/blog/grok-3