كيف يتعامل GPT-4.5

ما هي التقنيات المحددة التي يستخدمها GPT-4.5 للتعامل مع الرسائل المتضاربة

تستخدم GPT-4.5 العديد من التقنيات للتعامل مع الرسائل المتضاربة ، وخاصة من خلال نظام التسلسل الهرمي للتعليم. يحدد هذا التسلسل الهرمي ترتيبًا الأولوية للرسائل ، مما يضمن إعطاء الأولوية رسائل النظام على رسائل المستخدم ، وسجل المحادثة ، ومخرجات الأدوات [1] [2].

تعليمات التسلسل الهرمي

1. رسائل النظام مقابل رسائل المستخدم: يتم تدريب GPT-4.5 على اتباع الإرشادات في رسائل النظام عبر رسائل المستخدم المتضاربة. هذا أمر بالغ الأهمية في السيناريوهات التي قد تحاول فيها مدخلات المستخدم تجاوز إرشادات السلامة أو قواعد التنسيق التي حددها النظام [1] [2].

2. حل الصراع: يتم تقييم النموذج على قدرته على حل النزاعات بين أنواع مختلفة من الرسائل. على سبيل المثال ، إذا قامت رسالة النظام بتوجيه النموذج بعدم الكشف عن عبارة أو كلمة مرور محددة ، وحاولت رسالة المستخدم خداع النموذج في القيام بذلك ، تم تصميم GPT-4.5 للالتزام بتعليمات رسالة النظام [1].

3. التدريب والتقييم: يخضع GPT-4.5 للتدريب والتقييم المكثف لضمان تمكنه من التعامل مع السيناريوهات المعقدة حيث تتعارض رسائل النظام والرسائل. يتضمن ذلك السيناريوهات التي يجب أن تختار فيها النموذج بين اتباع تعليمات النظام أو طلب المستخدم الذي يتناقض معها [1] [2].

الخاضع للإشراف (SFT)

يستخدم GPT-4.5 أيضًا النقل الخاضع للإشراف (SFT) ، والذي يتضمن تدريب النموذج على أمثلة محددة حيث توجد رسائل متضاربة. تساعد هذه التقنية على تحسين قدرة النموذج على التعرف على تعليمات النظام وتحديد أولوياته على مدخلات المستخدم ، مما يعزز أدائه في التعامل مع السيناريوهات المتضاربة [3].

تقنيات محاذاة جديدة

بالإضافة إلى ذلك ، تتضمن GPT-4.5 تقنيات محاذاة جديدة تعزز فهمها للتفضيلات البشرية والنية. تساعد هذه التقنيات النموذج بشكل أفضل على تفسير السياق والنية وراء رسائل النظام والمستخدم بشكل أفضل ، مما يتيح له اتخاذ قرارات أكثر استنارة عند التعامل مع النزاعات [5].

بشكل عام ، يجمع نهج GPT-4.5 للتعامل مع الرسائل المتعارضة بين أساليب التدريب المتقدمة مع التسلسل الهرمي منظم للتعليمات لضمان أن النموذج يعطي الأولوية للسلامة والالتزام بإرشادات النظام.

الاستشهادات:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.08745v1
[3] https://www.vellum.ai/blog/gpt-4-5-is-heres-how-mood-tis-model-is
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-spructure/1025132
[5]
[6] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[7] https://openai.com/index/introducing-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/18monbs