تستخدم الأنثروبور الذكاء الاصطناعى الدستوري والتدريب على الضرر لضمان أن نماذج الذكاء الاصطناعى لها مفيدة وصادقة وغير ضارة [3]. يهدف هذا النهج إلى تقليل مخاطر العلامة التجارية ويضمن أن يكون نظام الذكاء الاصطناعي موثوقًا به وقابل للتفسير ، ومهكمة [3]. تم تصميم نماذج الإنسان لمعالجة كميات كبيرة من البيانات النصية وفهم وتوليد التعليمات البرمجية ، مما يجعلها مفيدة لمهام تطوير البرمجيات والتطبيقات الأخرى مثل خدمة العملاء والترميز القانوني [3].
تشمل الاختلافات الرئيسية في نهج الأنثروبور في التفكير ، مقارنة بنماذج اللغة الكبيرة التقليدية::
* التركيز على سلامة الذكاء الاصطناعي: أنثروبور مكرس لإنشاء أنظمة الذكاء الاصطناعى الموثوقة والقابلة للتفسير والتي تتماشى مع القيم الإنسانية ومعايير السلامة [2]. تركز الشركة على فهم وتخفيف المخاطر المرتبطة بـ AI من خلال البحث في معالجة اللغة الطبيعية ، والتعليقات البشرية ، والتفسير [2].
* منظمة العفو الدولية الدستورية: أنثروبور توظف الذكاء الاصطناعي الدستوري ، ويعلم النماذج الفرق بين الصواب والخطأ [7]. هذا النهج الجديد أمر بالغ الأهمية لأن نماذج اللغة تصبح بشكل متزايد مصادر للحقائق والحقيقة [7].
* الميزات القابلة للتفسير: يستخرج الباحثون في الإنسان الميزات القابلة للتفسير من نماذج لغة كبيرة مثل كلود 3 ، وترجمتها إلى مفاهيم قابلة للتفاهم البشري [4]. يمكن أن تنطبق هذه الميزات القابلة للتفسير على نفس المفهوم بلغات مختلفة ولكل من الصور والنص [4].
* رسم خرائط لعقل LLMS: قامت الأنثروبور بخطوات في فك رموز الأعمال الداخلية لنماذج اللغة الكبيرة (LLMS) باستخدام تعلم القاموس لرسم خريطة ملايين الميزات داخل نموذج الذكاء الاصطناعي ، كلود سونيت [2]. هذا يعزز سلامة الذكاء الاصطناعى وتفسيره ، مما يوفر فهمًا أعمق لكيفية معالجة الذكاء الاصطناعى المعلومات [2]. من خلال معالجة هذه الميزات ، يمكن للأنثروبور أن يغير استجابات كلود ، مما يدل على وجود علاقة سببية مباشرة بين تنشيط الخلايا العصبية وإخراج النموذج ، والذي يمكنه ضبط سلوك الذكاء الاصطناعي لتعزيز السلامة والأداء [2].
* المنطق الإنساني: يفترض التفكير الإنساني أن وجود المراقبين يفرض قيودًا على خصائص الكون [1]. يقترح المبدأ الضعيف للأنثروبور (WAP) أنه يمكننا فقط ملاحظة جوانب الكون المتوافقة مع وجودنا كمراقبين [1]. يقترح المبدأ الإنساني القوي (SAP) أن يتم تنظيم قوانين وثوابت الكون بحيث تكون الحياة حتمية [1]. يؤكد التفكير الإنساني على تحيز الاختيار المتأصل في ملاحظتنا ويوفر نظرة ثاقبة على صياغة الكون والقيود على الاستقصاء العلمي [1].
الاستشهادات:
[1]
[2]
[3] https://help.promptitude.io/en/articles/8892919-ressing-anthropic-models-a-simple-guide
[4]
[5]
[6] https://www.anthropic.com/research/mapping-mind-language-model
[7] https://www.marketingaiinstitute.com/blog/anthropic-claude-constitutional-ai
[8]