GPT-4.5, gelişmiş öğretim hiyerarşisi aracılığıyla çelişen mesajları ele almada GPT-4O üzerinde özel iyileştirmeler gösterir. Bu özellik, modelin sistem mesajlarını kullanıcı mesajları üzerinden önceliklendirmesine izin vererek, hızlı enjeksiyon riskini ve güvenlik talimatlarını geçersiz kılabilecek diğer saldırılar riskini hafifletir. İşte temel iyileştirmeler:
1. Öğretim Hiyerarşisi Değerlendirmesi: Farklı mesaj türlerinin birbirleriyle çatıştığı değerlendirmelerde, GPT-4.5 en yüksek öncelikli mesajda talimatları izlemek için eğitilir. Bu, modelin kullanıcı girişlerinin güvenlik protokollerini atlamaya çalışabileceği senaryoları daha iyi ele almasına yardımcı olur.
2. Çatışma çözümü: GPT-4.5 genellikle sistem ve kullanıcı mesajları arasındaki çatışmaları içeren değerlendirmelerde GPT-4O'dan daha iyi performans gösterir. Bu gelişme, karmaşık konuşma senaryolarındaki yönergelere güvenliği ve bağlılığını korumak için çok önemlidir.
3. Öğretmen Jailbreaks: Modelin matematik öğretmeni olarak görev yaptığı belirli bir senaryoda, GPT-4.5'e bir matematik sorusunun cevabını açıklamaması talimatı verilir. GPT-4.5, bu özel değerlendirmede GPT-4O'dan daha iyi performans göstermese de (GPT-4O'nun doğruluğu daha yüksektir), yine de yetkisiz bilgi sağlamaya kandırma girişimlerine direnmede sağlamlık göstermektedir.
4. İfade ve Parola Koruması: GPT-4.5, belirli ifadeleri veya şifrelerin kullanıcı istemleri yoluyla ortaya çıkmasını korumada güçlü bir performans gösterir. Bu, gizliliği sürdürme ve önceki bazı modellere kıyasla güvenlik yönergelerine uyma konusunda daha iyi bir yeteneği gösterir.
Genel olarak, GPT-4.5'in çelişkili mesajların ele alınmasındaki iyileştirmeleri, güvenlik, nüans ve işbirliğindeki daha geniş geliştirmelerinin bir parçasıdır, bu da güvenli ve uygun etkileşimleri sürdürmede daha etkilidir [1] [3].
Alıntılar:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-splained-estything-tou-need-to-nown
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-do-to-they-compare
[5] https://www.businessinsider.com/openai-sam-altman--gpt-4-5-emotionally-telligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-toul-should-now-about-the-new-tools
[7] https://ventureBeat.com/ai/openai-selues-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/