تحسينات GPT-4.5 في التعامل مع التعليمات المتضاربة وتحسين السلامة

كيف يقارن أداء GPT-4.5 بالإصدارات السابقة في التعامل مع التعليمات المتضاربة

يوضح GPT-4.5 تحسين الأداء في التعامل مع الإرشادات المتضاربة مقارنة بالإصدارات السابقة ، وخاصة من خلال التزامها المعزز في التسلسل الهرمي للتعليم. يسمح هذا التسلسل الهرمي للنموذج بتحديد أولويات رسائل النظام عبر مدخلات المستخدم ، مما يخفف من المخاطر من المطالبات المتضاربة. في التقييمات ، يتفوق GPT-4.5 عمومًا على GPT-4O في السيناريوهات التي تتعارض فيها رسائل النظام ورسائل المستخدم ، مما يشير إلى قدرة أفضل على اتباع تعليمات السلامة وتجنب الخداع بواسطة مطالبات عدوانية [1] [5].

تحسينات المفاتيح في التعامل مع التعليمات المتضاربة

1. تقييم التسلسل الهرمي للإرشادات: يعرض GPT-4.5 دقة محسّنة في تعليمات النظام التالية عبر رسائل المستخدم. على سبيل المثال ، في السيناريو الذي يُطلب منه تعليمات النموذج بعدم التخلي عن الإجابة على سؤال الرياضيات ، يؤدي GPT-4.5 أداء أفضل من GPT-4O ، وإن لم يكن وكذلك GPT-4O1 [1].

2. التخفيف من الحقن السريعة: من خلال تحديد أولويات رسائل النظام ، يقلل GPT-4.5 من خطر الحقن الفوري والهجمات الأخرى التي يمكن أن تتجاوز تعليمات السلامة الخاصة بها. هذا أمر بالغ الأهمية للحفاظ على سلامة النموذج ومنع سوء الاستخدام [1] [5].

3. السيناريوهات الواقعية: في السيناريوهات الأكثر واقعية ، مثل عند العمل كمدرس للرياضيات ، يعد GPT-4.5 أفضل في مقاومة محاولات خداعها لتوفير معلومات غير مصرح بها. ومع ذلك ، فإن أدائها ليس مثاليًا ويمكن أن يختلف حسب السياق والتعليمات المحددة المقدمة [1].

4. تقييمات السلامة: يخضع GPT-4.5 لتقييمات سلامة صارمة لضمان عدم الامتثال لطلبات المحتوى الضار. على الرغم من أنه يعمل بشكل جيد في رفض المحتوى غير الآمن ، إلا أنه قد يفرط في أكثر من النماذج السابقة ، مما يشير إلى اتباع نهج حذر للتعامل مع مطالبات غامضة أو محفوفة بالمخاطر [1].

بشكل عام ، يقدم GPT-4.5 تحسينات كبيرة في التعامل مع الإرشادات المتضاربة من خلال الالتزام بإرشادات النظام بشكل أوثق وتقليل تأثير مدخلات المستخدمين العدوانيين. ومع ذلك ، مثل جميع نماذج الذكاء الاصطناعي ، فهي ليست محصنة ضد جميع أشكال التلاعب وتستمر في التطور مع تقييمات وتحديثات السلامة المستمرة [1] [5].

الاستشهادات:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-heres-how-mood-tis-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-bigest-differences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs
[7] https://www.theverge.com/news/620021/openai-gpt-4-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-reasoning