Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuinka antropian hybridi -AI -malli verrataan muihin AI -malleihin suorituskyvyn suhteen


Kuinka antropian hybridi -AI -malli verrataan muihin AI -malleihin suorituskyvyn suhteen


Antropisin Claude 3.5 Sonet on uusi ja tehokas generatiivinen AI-malli, joka ylittää kilpailijat, kuten chatgpt-4o useilla alueilla [1]. Sisäisessä agenttisessa koodausarvioinnissa Claude 3,5 Sonnet ratkaisi 64% ongelmista, kun taas Claude 3 OPUS ratkaisi 38% [1]. Tutkinnon suorittaneiden päättelyjen perusteella se sai 59% verrattuna ChatgPT-4O: n 53%: iin [1]. Tekstin päättelyssä Claude 3.5 Sonnet sai 87%, ylittäen CHATGPT-4O (83%), Googlen Kaksoset (74%) ja Meta's Llaama (83%) [1]. ChatgPT-4O oli kuitenkin 5% tarkempi kuin Claude 3.5 matematiikan ongelmanratkaisussa [1].

Antropisin, kaari-challengen ja Hellaswagin vertailuarvot, Antropicin tiedot viittaavat MMLU: n, GPQA: n, GSM8K: n, matematiikan, MGSM: n, Humanevalin, Drop-, Big-Bench-Hard, ARC-Challenge- ja Hellaswag, GPT-4 [2]. Nämä testit käsittävät laajan tiedon tosiasioista ja matematiikasta perusteluihin ja koodien luomiseen [2].

Antropisin Claude 3 -mallit, erityisesti Opus, ylittävät yleensä Openain GPT-4 ja Googlen Gemini-mallit eri tehtävissä [3]. Claude 3 osoitti parempaa suorituskykyä koodaustehtävissä, pisteytys 84,9%vertailuarvoilla, kuten Humaneval, ylittäen GPT-4 (67%) ja Gemini 1,0 Pro (67,7%) [3]. Claude 3 Sonnet menestyi myös monimutkaisissa kvantitatiivisissa analyysitehtävissä, joissa GPT-4 ja Gemini toisinaan kamppailivat [3].

Antropinen on laajentunut tekstin ulkopuolelle visuaaliseen syöttöön koulutustietoihin Claude 3 -perheen kanssa [7]. Claude 3 -mallien avulla käyttäjät voivat myös analysoida tietoja, mukaan lukien kuvat, kaaviot ja asiakirjat, uuden multimodaalisen tukiominaisuuden kautta [4].

AI -mallia valittaessa yritysten tulee harkita tarkkuutta, nopeutta, yksityisyyttä, helppokäyttöisen tai ylläpidon ja kustannuksia [4].

Viittaukset:
.
[2] https://synthedia.substack.com/p/anthropic-says-it-just-dethroned
[3] https://www.voiceflow.com/articles/anthropic-ai
.
[5] https://cloud.google.com/solutions/anthropic
.
.
[8] https://big-agi.com/blog/ai-api-comparison-2024-antropic-vs-google-vs-openai