Anthropics Claude 3.5 Sonett: Ein neuer Benchmark in generativer KI

Wie ist das Hybrid -KI -Modell von Anthropic im Vergleich zu anderen KI -Modellen in Bezug auf die Leistung vergleichbar?

Das Claude 3.5-Sonett von Anthropic ist ein neues und leistungsstarkes generatives KI-Modell, das Konkurrenten wie Chatgpt-4O in mehreren Bereichen übertrifft [1]. In einer internen Agenten -Codierungsbewertung löste Claude 3.5 Sonett 64% der Probleme, während Claude 3 Opus 38% löste [1]. Bei der Argumentation auf Graduiertenebene erzielte es im Vergleich zu 53% von ChatGPT-4O 59% [1]. In der Argumentation über Text erzielte Claude 3.5 Sonnet 87%und übertraf Chatgpt-4o (83%), Googles Gemini (74%) und Lama von Meta (83%) [1]. Chatgpt-4O war jedoch 5% genauer als Claude 3.5 in der Mathematik-Problemlösung [1].

In der gesamten MMLU-, GPQA-, GSM8K-, Math-, MGSM-, Humaneal-, Drop-, Big-Bench-Hard-, Arc-Challenge- und Hellaswag-Benchmarks schlägt die Daten von Anthropic vor, dass sie GPT-4 übertreffen [2]. Diese Tests umfassen eine breite Palette von Wissen, von Fakten und Mathematik bis hin zu Argumentation und Codegenerierung [2].

Die Claude 3-Modelle von Anthropic, insbesondere Opus, übertreffen im Allgemeinen OpenAs GPT-4- und Google-Modelle von Gemini zu verschiedenen Aufgaben [3]. Claude 3 zeigte eine überlegene Leistung bei Codierungsaufgaben und erzielte 84,9%für Benchmarks wie Humaneval, Outperforming GPT-4 (67%) und Gemini 1.0 Pro (67,7%) [3]. Claude 3 Sonett war auch bei komplexen quantitativen Analyseaufgaben hervorragend, bei denen GPT-4 und Gemini manchmal Probleme hatten [3].

Anthropic hat sich mit der Claude 3 -Familie über den Text über die visuellen Eingabe für Trainingsdaten hinaus erweitert [7]. Mit den Claude 3 -Modellen können Benutzer auch über die neue multimodale Support -Funktion Daten, einschließlich Bilder, Diagramme und Dokumente, analysieren [4].

Bei der Auswahl eines KI -Modells sollten Unternehmen Genauigkeit, Geschwindigkeit, Privatsphäre, einfache Bereitstellung oder Wartung und Kosten berücksichtigen [4].

Zitate:
[1] https://www.euronews.com/next/2024/06/20/anthropic-launches-it-latest-most-powerful-generative-ai-model
[2] https://synthedia.substack.com/p/anthropic-says-it-just-dhroned
[3] https://www.voiceflow.com/articles/anthropic-ai
[4] https://www.pymnts.com/news/artificial-intelligence/2024/how-anthropics-new-claude-3-ai-model-stacks-up-against-the-competition/
[5] https://cloud.google.com/solutions/anthropic
[6] https://www.promptitude.io/post/navigating-the-ai-landscape-openai-vs-anthropic-vs-google-ai-in-2024
[7] https://www.nextplatform.com/2024/03/05/anthropic-fires-off-performance-forance-1rice-salvos-in-ai-war/
[8] https://big-agi.com/blog/ai-api-comparison-2024-anthropic-vs-google-vs-penai