كلود 3.5 سونيت الأنثروبري: معيار جديد في الذكاء الاصطناعي

كيف يقارن نموذج الذكاء الاصطناعى الهجين من الأنثروبور بنماذج الذكاء الاصطناعى الأخرى من حيث الأداء

يعد كلود 3.5 Sonnet من الأنثروبور نموذجًا جديدًا وقويًا من الذكاء الاصطناعي يتفوق على المنافسين مثل chatgpt-4o في عدة مجالات [1]. في تقييم ترميز الوكيل الداخلي ، حل كلود 3.5 السوناتة 64 ٪ من المشكلات ، في حين أن كلود 3 OPUS حل 38 ٪ [1]. على المنطق على مستوى الدراسات العليا ، سجل 59 ٪ مقارنة بـ ChatGPT-4O's 53 ٪ [1]. في التفكير على النص ، سجل كلود 3.5 Sonnet 87 ٪ ، يتفوق على chatgpt-4o (83 ٪) ، وجيميني Google (74 ٪) ، و Meta's Llama (83 ٪) [1]. ومع ذلك ، كان ChatGPT-4O أكثر دقة بنسبة 5 ٪ من Claude 3.5 في حل المشكلات في الرياضيات [1].

عبر MMLU ، GPQA ، GSM8K ، MATH ، MGSM ، Humaneval ، Drop ، Big Bench-Hard ، Arc-Callenge ، و Hellaswag Benchmarks ، تشير بيانات الأنثروبور إلى أنها تتفوق على GPT-4 [2]. تشمل هذه الاختبارات مجموعة واسعة من المعرفة ، من الحقائق والرياضيات إلى التفكير وتوليد الكود [2].

تتفوق طرازات كلود 3 من الأنثروبور ، وخاصة OPUS ، بشكل عام على نماذج GPT-4 من Openai ونماذج GEMINI من Google في مختلف المهام [3]. أظهر Claude 3 أداءً فائقًا في مهام الترميز ، حيث سجل 84.9 ٪ على المعايير مثل Humaneval ، يتفوق على GPT-4 (67 ٪) و Gemini 1.0 Pro (67.7 ٪) [3]. كلود 3 سونيت تفوق أيضا في مهام التحليل الكمي المعقدة ، حيث تكافح GPT-4 و Gemini في بعض الأحيان [3].

توسعت الأنثروبور إلى ما وراء النص إلى إدخال مرئي لبيانات التدريب مع عائلة كلود 3 [7]. تتيح طرز Claude 3 للمستخدمين أيضًا تحليل البيانات ، بما في ذلك الصور والمخططات والمستندات ، من خلال ميزة الدعم المتعددة الوسائط الجديدة [4].

عند اختيار نموذج الذكاء الاصطناعي ، يجب أن تنظر الشركات في الدقة والسرعة والخصوصية وسهولة النشر أو الصيانة ، والتكلفة [4].

الاستشهادات:
[1] https://www.euronews.com/next/2024/06/20/anthropic-launches-its-latest-most-powerful-generative-ai-model
[2] https://synthedia.substack.com/p/anthropic-says-it-t-just-dethroned
[3] https://www.voiceflow.com/articles/anthropic-ai
[4] https://www.pymnts.com/news/artificial-intelligence/2024/how-anthropics-new-claude-3-ai-model-stacks- up-against-the-competition/
[5] https://cloud.google.com/solutions/anthropic
[6] https://www.promptitude.io/post/navigating-the-ai-landscape-openai-vs-anthropic-vs-google-ai-in-2024
[7]
[8] https://big-agi.com/blog/ai-api-comparison-2024-anthropic-vs-google-vs-openai