يعد كلود 3.5 Sonnet من الأنثروبور نموذجًا جديدًا وقويًا من الذكاء الاصطناعي يتفوق على المنافسين مثل chatgpt-4o في عدة مجالات [1]. في تقييم ترميز الوكيل الداخلي ، حل كلود 3.5 السوناتة 64 ٪ من المشكلات ، في حين أن كلود 3 OPUS حل 38 ٪ [1]. على المنطق على مستوى الدراسات العليا ، سجل 59 ٪ مقارنة بـ ChatGPT-4O's 53 ٪ [1]. في التفكير على النص ، سجل كلود 3.5 Sonnet 87 ٪ ، يتفوق على chatgpt-4o (83 ٪) ، وجيميني Google (74 ٪) ، و Meta's Llama (83 ٪) [1]. ومع ذلك ، كان ChatGPT-4O أكثر دقة بنسبة 5 ٪ من Claude 3.5 في حل المشكلات في الرياضيات [1].
عبر MMLU ، GPQA ، GSM8K ، MATH ، MGSM ، Humaneval ، Drop ، Big Bench-Hard ، Arc-Callenge ، و Hellaswag Benchmarks ، تشير بيانات الأنثروبور إلى أنها تتفوق على GPT-4 [2]. تشمل هذه الاختبارات مجموعة واسعة من المعرفة ، من الحقائق والرياضيات إلى التفكير وتوليد الكود [2].
تتفوق طرازات كلود 3 من الأنثروبور ، وخاصة OPUS ، بشكل عام على نماذج GPT-4 من Openai ونماذج GEMINI من Google في مختلف المهام [3]. أظهر Claude 3 أداءً فائقًا في مهام الترميز ، حيث سجل 84.9 ٪ على المعايير مثل Humaneval ، يتفوق على GPT-4 (67 ٪) و Gemini 1.0 Pro (67.7 ٪) [3]. كلود 3 سونيت تفوق أيضا في مهام التحليل الكمي المعقدة ، حيث تكافح GPT-4 و Gemini في بعض الأحيان [3].
توسعت الأنثروبور إلى ما وراء النص إلى إدخال مرئي لبيانات التدريب مع عائلة كلود 3 [7]. تتيح طرز Claude 3 للمستخدمين أيضًا تحليل البيانات ، بما في ذلك الصور والمخططات والمستندات ، من خلال ميزة الدعم المتعددة الوسائط الجديدة [4].
عند اختيار نموذج الذكاء الاصطناعي ، يجب أن تنظر الشركات في الدقة والسرعة والخصوصية وسهولة النشر أو الصيانة ، والتكلفة [4].
الاستشهادات:
[1] https://www.euronews.com/next/2024/06/20/anthropic-launches-its-latest-most-powerful-generative-ai-model
[2] https://synthedia.substack.com/p/anthropic-says-it-t-just-dethroned
[3] https://www.voiceflow.com/articles/anthropic-ai
[4] https://www.pymnts.com/news/artificial-intelligence/2024/how-anthropics-new-claude-3-ai-model-stacks- up-against-the-competition/
[5] https://cloud.google.com/solutions/anthropic
[6] https://www.promptitude.io/post/navigating-the-ai-landscape-openai-vs-anthropic-vs-google-ai-in-2024
[7]
[8] https://big-agi.com/blog/ai-api-comparison-2024-anthropic-vs-google-vs-openai