Anthropic's Claude 3.5 sonet: un nou punct de referință în AI generativ

Cum se compară modelul AI hibrid al Antropic cu alte modele AI în ceea ce privește performanța

Sonetul Claude 3,5 al Anthropic este un nou și puternic model AI generativ care depășește concurenții precum ChatGPT-4O în mai multe domenii [1]. Într -o evaluare a codificării agentice interne, Claude 3,5 sonet a rezolvat 64% din probleme, în timp ce Claude 3 Opus a rezolvat 38% [1]. La raționamentul la nivel de absolvenți, a marcat 59% în comparație cu 53% din ChatGPT-4O [1]. În raționarea textului, Claude 3,5 Sonet a marcat 87%, depășind ChatGPT-4O (83%), Gemini Google (74%) și Llama Meta (83%) [1]. Cu toate acestea, ChatGPT-4O a fost cu 5% mai exact decât Claude 3.5 în rezolvarea problemelor matematice [1].

De-a lungul MMLU, GPQA, GSM8K, MATH, MGSM, HOMEVAL, DROP, BIG-BENCH-HARD, Arc Challenge și Hellaswag. Aceste teste cuprind o gamă largă de cunoștințe, de la fapte și matematică la raționament și generare de coduri [2].

Modelele Claude 3 ale Anthropic, în special Opus, depășesc, în general, modelele GPT-4 OpenAI și Google Gemini pe diverse sarcini [3]. Claude 3 a arătat o performanță superioară în sarcinile de codificare, marcând 84,9%pe repere precum Humeval, depășind GPT-4 (67%) și Gemeni 1.0 Pro (67,7%) [3]. Sonnet Claude 3 a excelat, de asemenea, la sarcini complexe de analiză cantitativă, în care GPT-4 și Gemeni s-au luptat uneori [3].

Antropic s -a extins dincolo de text în aportul vizual pentru datele de instruire cu familia Claude 3 [7]. Modelele Claude 3 permit, de asemenea, utilizatorilor să analizeze date, inclusiv imagini, diagrame și documente, prin noua sa caracteristică de asistență multimodală [4].

Atunci când aleg un model AI, întreprinderile ar trebui să ia în considerare precizia, viteza, confidențialitatea, ușurința implementării sau întreținerea și costul [4].

Citări:
[1] https://www.euronews.com/next/2024/06/20/anthropic-launches-its-latest-most-powerful-generative-AI-model
[2] https://synthedia.substack.com/p/antropic-says-it-just-dethroron
[3] https://www.voiceflow.com/articles/antropic-AI
[4] https://www.pymnts.com/news/artificial-Intelligence/2024/how-antropics-new-claude-3-AI-model-tacks-up-against-the-cupetition/
[5] https://cloud.google.com/solutions/antropic
[6] https://www.prompitude.io/post/navigating-the-AI-LANDSCAPE-Openai-vs-Anthropic-vs-Google-AI-in-2024
[7] https://www.nextplatform.com/2024/03/05/anthropic-fires-of-performance-and-price-salvos-in-ai-war/
[8] https://big-agi.com/blog/ai-api-comparison-2024-antropic-vs-google-vs-openai