GPT-4.5, özellikle gelişmiş öğretim hiyerarşisiyle, daha önceki sürümlere kıyasla çelişkili talimatların işlenmesinde gelişmiş performans gösterir. Bu özellik, modelin sistem mesajlarını kullanıcı girişleri üzerinden önceliklendirmesini sağlar, hızlı enjeksiyonlarla ilişkili riskleri ve güvenlik talimatlarını geçersiz kılabilecek diğer saldırılarla ilişkili riskleri hafifletir.
Çelişkili mesaj türlerini içeren değerlendirmelerde, GPT-4.5 genellikle GPT-4O'dan daha iyi performans gösterir. Model, sistem ve kullanıcı mesajlarının çatıştığı senaryolarda yardımcı olan en yüksek öncelikli mesajda talimatları izlemek için eğitilmiştir. Örneğin, modelin bir matematik sorusunun cevabını vermemesi talimatı verildiği bir senaryoda, GPT-4.5, tüm değerlendirmelerde GPT-4O1'i aşmamasına rağmen, GPT-4O'ya kıyasla bu sistem talimatlarına daha iyi uyum gösterir [1].
Ek olarak, GPT-4.5, belirli ifadeleri veya şifreleri kullanıcı istemleri yoluyla açıklanmasını önlemesi gereken senaryolarda değerlendirilmiştir. Bu değerlendirmelerde, GPT-4.5 iyi performans gösterir, bu da çelişkili kullanıcı girişleriyle karşılaştığında bile güvenliği koruma ve sistem talimatlarını takip etme yeteneğini gösterir [1].
Bununla birlikte, GPT-4.5, çelişkili talimatların ele alınmasında önceki modellerde iyileşirken, bazı karmaşık senaryolarda hala zorluklarla karşı karşıyadır. Modelin, düşmanca yönlendirmeyi simüle eden kırmızı takım değerlendirmelerindeki performansı, bazı durumlarda güvensiz çıktı üretebileceğini göstermektedir, ancak genellikle bu zorlu testlerde GPT-4O'dan daha iyi performans gösterir [1].
Genel olarak, GPT-4.5'in çelişkili talimatların ele alınmasındaki geliştirmeleri, güvenlik kılavuzlarına ve sistem talimatlarına sıkı sıkıya bağlı kalma gerektiren uygulamalar için daha güvenilir bir seçim haline getirir.
Alıntılar:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkatif.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-how-good-this-model-
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-bigest-defferences-to-conder
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_significentent_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-tion-ai-model-se-
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-