Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon ما مدى فعالية GPT-4.5 في التخفيف من المخاطر المتعلقة بـ CBRN والإقناع


ما مدى فعالية GPT-4.5 في التخفيف من المخاطر المتعلقة بـ CBRN والإقناع


تم تقييم GPT-4.5 لفعاليتها في التخفيف من المخاطر المتعلقة بالتهديدات الكيميائية والبيولوجية والإشعاعية والنووية (CBRN) والإقناع. فيما يلي نظرة عامة مفصلة على قدراتها وتخفيفها:

مخاطر CBRN

تم تصنيف GPT-4.5 على أنه خطر متوسط ​​لتهديدات CBRN. يعتمد هذا التصنيف على تقييمات تقييم قدرة النموذج على المساعدة في التخطيط التشغيلي لإعادة إنتاج التهديدات البيولوجية المعروفة. ومع ذلك ، يعتبر هذا الخطر محدودًا لأنه يساعد في المقام الأول خبراء الذين لديهم بالفعل خبرة كبيرة في مجال المجال [1].

للتخفيف من مخاطر CBRN ، يستخدم GPT-4.5 العديد من الاستراتيجيات:

- تخفيف ما قبل التدريب: يقوم النموذج بتصفية البيانات المتعلقة بانتشار CBRN الذي له استخدام محدود أو بدون استخدام مشروع. هذا يساعد على تقليل تعرض النموذج للمعلومات الخطيرة المحتملة [1].
- متانة النموذج: تم تصميم GPT-4.5 لتحمل المستخدمين الخبيثين والعدوانيين من خلال تحسين قدرتها على مقاومة التلاعب المتعلقة بتهديدات CBRN [1].
- المراقبة والاكتشاف: يتم بذل جهود مخصصة لمراقبة الأنشطة المتعلقة بمهام CBRN واكتشافها ، مما يضمن تحديد أي سوء استخدام بسرعة ومعالجته [1].

مخاطر الإقناع

يحمل GPT-4.5 أيضًا تعيينًا متوسطًا للمخاطر للإقناع. ويرجع ذلك إلى أدائها الحديث في توليد محتوى مقنع ، والذي يمكن استخدامه لمعالجة المعتقدات أو الإجراءات [2].

لمعالجة مخاطر الإقناع ، يتضمن GPT-4.5 التخفيفات التالية:

- تدريب السلامة: يخضع النموذج تدريبًا محددًا للتعامل مع مهام الإقناع السياسي بمسؤولية ، بهدف منع سوء الاستخدام للتأثير على الرأي العام أو التلاعب به [1].
- مراقبة عمليات التأثير: هناك مراقبة مستمرة والتحقيق في الانتهاكات المشتبه بها المتعلقة بعمليات التأثير والتطرف والأنشطة السياسية غير الصحيحة. هذا يساعد على تحديد وتخفيف مخاطر الإقناع المحتملة [1].
- إعادة النظر في تقييمات الإقناع: يعيد Openai تقييم نهجه لتقييم مخاطر الإقناع في العالم الحقيقي ، والتركيز على عوامل مثل تخصيص المحتوى والتوزيع والعرض مع مرور الوقت [2].

بشكل عام ، في حين أن GPT-4.5 يقدم مخاطر متوسطة لكل من CBRN والإقناع ، فإنه يستخدم مجموعة قوية من التخفيفات لتقليل هذه المخاطر. وتشمل هذه التصفية المتقدمة ، والتدريب على السلامة ، والمراقبة المستمرة لضمان استخدام النموذج بمسؤولية وأمان.

الاستشهادات:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhxlaehuyu7db/64e9f7916d3581ba4b5d0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[3] https://centerforhealthsecurity.org/sites/default/files/2024-06/2024-06-02-jhchs-nist-ai-6001-rfc.pdf
[4] https://model-spec.openai.com
[5] https://www.reddit.com/r/chatgpt/comments/1iznoek/gpt45_system_card_mmlu_896/
[6] https://pmc.ncbi.nlm.nih.gov/articles/PMC10795998/
[7] https://openai.com/index/gpt-4-5-system-card/
[8]