Το CLAUDE 3,5 Sonnet του Anthropic είναι ένα νέο και ισχυρό γενετικό μοντέλο AI που ξεπερνά τους ανταγωνιστές όπως το ChatGPT-4O σε αρκετούς τομείς [1]. Σε μια εσωτερική αξιολόγηση κωδικοποίησης πρακτορείων, ο Claude 3,5 Sonnet λύθηκε το 64% των προβλημάτων, ενώ ο Claude 3 OPUS επιλύθηκε 38% [1]. Κατά τη λογική του μεταπτυχιακού επιπέδου, σημείωσε 59% σε σύγκριση με το 53% του CHATGPT-4O [1]. Κατά τη συλλογιστική πάνω από το κείμενο, ο Claude 3,5 Sonnet σημείωσε 87%, ξεπερνώντας το ChatGPT-4O (83%), το Gemini (74%) και το LLAMA της Meta (83%) [1]. Ωστόσο, το ChatGPT-4O ήταν 5% πιο ακριβές από το CLAUDE 3,5 στην επίλυση προβλημάτων μαθηματικών [1].
Σε όλη την MMLU, GPQA, GSM8K, MATH, MGSM, Humaneval, Drop, Big Bench-Hard, Arc-Challenge και Hellaswag Benchmarks, τα δεδομένα του Anthropic υποδηλώνουν ότι ξεπερνά το GPT-4 [2]. Αυτές οι δοκιμές περιλαμβάνουν ένα ευρύ φάσμα γνώσεων, από τα γεγονότα και τα μαθηματικά έως τη συλλογιστική και την παραγωγή κώδικα [2].
Τα μοντέλα Claude 3 της Anthropic, ειδικά Opus, γενικά ξεπερνούν τα μοντέλα GPT-4 της OpenAI και Google Gemini σε διάφορα καθήκοντα [3]. Ο Claude 3 έδειξε ανώτερες επιδόσεις σε εργασίες κωδικοποίησης, σημειώνοντας 84,9%σε σημεία αναφοράς όπως το Humaneval, που ξεπερνάει το GPT-4 (67%) και το Gemini 1,0 Pro (67,7%) [3]. Ο Claude 3 Sonnet διακρίθηκε επίσης σε πολύπλοκα καθήκοντα ποσοτικής ανάλυσης, όπου οι GPT-4 και οι Δίδυμοι μερικές φορές αγωνίστηκαν [3].
Το Anthropic έχει επεκταθεί πέρα από το κείμενο σε οπτικές εισροές για δεδομένα εκπαίδευσης με την οικογένεια Claude 3 [7]. Τα μοντέλα Claude 3 επιτρέπουν επίσης στους χρήστες να αναλύουν δεδομένα, συμπεριλαμβανομένων εικόνων, διαγραμμάτων και εγγράφων, μέσω της νέας λειτουργίας πολυτροπικής υποστήριξης [4].
Κατά την επιλογή ενός μοντέλου AI, οι επιχειρήσεις θα πρέπει να εξετάσουν την ακρίβεια, την ταχύτητα, την ιδιωτική ζωή, την ευκολία ανάπτυξης ή τη συντήρηση και το κόστος [4].
Αναφορές:
[1] https://www.euronews.com/next/2024/06/20/anthropic-launches-its-latest-most-powerful-fenerative-ai-model
[2] https://synthedia.substack.com/p/anthropic-says-it-s Just-Dethroned
[3] https://www.voiceflow.com/articles/anthropic-ai
[4] https://www.pymnts.com/news/artificial-intelligence/2024/how-anthropics-new-claude-3-ai-model-stacks-phainst-the-getition/
[5] https://cloud.google.com/solutions/anthropic
[6] https://www.promptitude.io/post/navigating-the-ai-landscape-openai-vs-anthropic-vs-google-ai-in-2024
[7] https://www.nextplatform.com/2024/03/05/anthropic-fires-off-performance-and-price-salvos-in-ai-war/
[8] https://big-agi.com/blog/ai-api-comparison-2024-anthropic-vs-google-vs-openai