Sonetto Claude 3.5 di Antropic: un nuovo punto di riferimento in AI generativa

Come si confronta il modello Ibrido AI di Antropico con altri modelli AI in termini di prestazioni

Il sonetto Claude 3.5 di Antropic è un nuovo e potente modello di AI generativo che supera i concorrenti come CHATGPT-4O in diverse aree [1]. In una valutazione della codifica agente interna, Claude 3.5 Sonnet ha risolto il 64% dei problemi, mentre Claude 3 Opus ha risolto il 38% [1]. Sul ragionamento a livello di laurea, ha segnato il 59% rispetto al 53% di CHATGPT-4O [1]. Nel ragionamento sul testo, Claude 3.5 Sonet ha segnato l'87%, sovraperformando Chatgpt-4o (83%), Google's Gemini (74%) e Meta's Lama (83%) [1]. Tuttavia, CHATGPT-4O era del 5% più accurato di Claude 3,5 nella risoluzione dei problemi di matematica [1].

Attraverso MMLU, GPQA, GSM8K, Math, MGSM, Humanival, Drop, Big Bench-Hard, Arc-Challenge e Hellaswag Benchmarks, i dati antropici suggeriscono che supera GPT-4 [2]. Questi test comprendono una vasta gamma di conoscenze, dai fatti e matematica alla generazione di ragionamenti e codice [2].

I modelli Claude 3 di Antropic, in particolare Opus, generalmente superano i modelli GPT-4 di Openi e Google su vari compiti [3]. Claude 3 ha mostrato prestazioni superiori nelle attività di codifica, segnando l'84,9%su parametri di riferimento come Humanival, sovraperformando GPT-4 (67%) e Gemini 1.0 Pro (67,7%) [3]. Claude 3 Sonnet eccelleva anche in complessi compiti di analisi quantitativa, in cui GPT-4 e Gemini a volte lottavano [3].

Antropico si è esteso oltre il testo in input visivi per i dati di addestramento con la famiglia Claude 3 [7]. I modelli Claude 3 consentono inoltre agli utenti di analizzare i dati, inclusi immagini, grafici e documenti, attraverso la sua nuova funzione di supporto multimodale [4].

Quando si sceglie un modello di intelligenza artificiale, le aziende dovrebbero considerare accuratezza, velocità, privacy, facilità di distribuzione o manutenzione e costo [4].

Citazioni:
[1] https://www.euronews.com/next/2024/06/20/anthropopic-launches-its-latest-most-powerful-generative-ai-model
[2] https://synthedia.substack.com/p/anthropopic-says-it-just-detronited
[3] https://www.voiceflow.com/articles/anthropic-ai
[4] https://www.pymsts.com/news/artificial-intelligence/2024/how-anthropics-new-claude-3-imodel-stacks-up-against-the-competition/
[5] https://cloud.google.com/solutions/anthropic
[6] https://www.promptitude.io/post/navigating-the-ai-landscape-openai-vs-anthropic-vs-google-ai-in -2024
[7] https://www.nextplatform.com/2024/03/05/anthropopic-fires-off-performance-and-price-salvos-in-ai-war/
[8] https://big-agi.com/blog/ai-api-comparison-2024-anthropopic-vs-google-vs-openai