Deepseek-R1: n suorituskyky AIME 2024 -vertailussa on huomattava, koska se on 79,8%, hieman edellä OpenAi O1-1217: stä, joka saavuttaa 79,2%[1]. DeepSeek-R1: n ja GPT-4O-0513 välillä on kuitenkin saatavana rajoitettua suoraa vertailua erityisesti AIME 2024 -vertailuarvolla.
GPT-4O-mallit tunnetaan yleisesti voimakkaasta suorituskyvystään eri tehtävissä, mutta AIME 2024: n GPT-4O-0513 erityisiä tuloksia ei ole yksityiskohtaisesti käytettävissä olevissa tiedoissa. GPT-4O-mallit ovat tyypillisesti vahvoja kielten ymmärtämisessä ja sukupolven tehtävissä, mutta niiden suorituskyky erikoistuneissa matemaattisissa päättelyarvoissa, kuten AIME, voivat vaihdella verrattuna tällaisiin tehtäviin optimoituihin malleihin, kuten Deepseek-R1.
Deepseek-R1: n vahva suorituskyky Aime 2024: llä voidaan johtua sen arkkitehtuurista, joka sisältää laajamittaisen vahvistusoppimisen päättelymahdollisuuksien parantamiseksi. Tämä lähestymistapa antaa sen menestyä tehtävissä, jotka vaativat edistynyttä monivaiheista matemaattista päättelyä [1] [3]. Sitä vastoin GPT-4O-mallit ovat yleisempiä, eikä niillä ehkä ole samanlaista erikoistumista matemaattisiin päättelytehtäviin.
Kaiken kaikkiaan DeepSeek-R1 osoittaa erinomaisen suorituskyvyn Aime 2024: llä verrattuna OpenAI O1-1217: een, suoria vertailuja GPT-4O-0513: lla ei ole nimenomaisesti käytettävissä olevissa tiedoissa. Deepseek-R1: n erikoistunut koulutus ja arkkitehtuuri todennäköisesti edistävät sen vahvaa näyttelyä matemaattisissa päättelyarvoissa.
Viittaukset:
[1] https://www.datacamp.com/blog/deepseek-R1
[2] https://blog.getbind.co/2025/01/23/deepseek-r1-vs-gpt-o1-vs-claude-3-5-sonnet-which--best-for-coding/
[3] https://docsbot.ai/models/compare/gpt-4o-2024-05-13/deepseek-r1
[4] https://artificialanalysis.ai/models/deepseek-R1
[5] https://docsbot.ai/models/compare/deepseek-r1/gpt-4o
[6] https://llm-stats.com/models/compare/deepseek-r1-vs-gpt-4o-2024-08-06
.
[8] https://docsbot.ai/models/compare/gpt-4o/deepseek-R1