GPT-4.5 menunjukkan peningkatan spesifik dibandingkan GPT-4O dalam menangani pesan yang bertentangan melalui hierarki instruksi yang ditingkatkan. Fitur ini memungkinkan model untuk memprioritaskan pesan sistem daripada pesan pengguna, mengurangi risiko suntikan yang cepat dan serangan lain yang mungkin mengganti instruksi keselamatan. Berikut adalah perbaikan utama:
1. Evaluasi Hirarki Instruksi: Dalam evaluasi di mana berbagai jenis pesan bertentangan satu sama lain, GPT-4.5 dilatih untuk mengikuti instruksi dalam pesan prioritas tertinggi. Ini membantu model untuk menangani skenario yang lebih baik di mana input pengguna mungkin mencoba memotong protokol keselamatan.
2. Resolusi Konflik: GPT-4.5 Umumnya mengungguli GPT-4O dalam evaluasi yang melibatkan konflik antara sistem dan pesan pengguna. Peningkatan ini sangat penting untuk menjaga keamanan dan kepatuhan terhadap pedoman dalam skenario percakapan yang kompleks.
3. Tutor Jailbreaks: Dalam skenario tertentu di mana model bertindak sebagai tutor matematika, GPT-4.5 diinstruksikan untuk tidak mengungkapkan jawaban atas pertanyaan matematika. Sementara GPT-4.5 tidak mengungguli GPT-4O dalam evaluasi khusus ini (akurasi GPT-4O lebih tinggi), masih menunjukkan ketahanan dalam menolak upaya untuk menipu agar memberikan informasi yang tidak sah.
4. Perlindungan frasa dan kata sandi: GPT-4.5 menunjukkan kinerja yang kuat dalam melindungi frasa atau kata sandi tertentu agar tidak diungkapkan melalui petunjuk pengguna. Ini menunjukkan kemampuan yang lebih baik untuk menjaga kerahasiaan dan mematuhi pedoman keamanan dibandingkan dengan beberapa model sebelumnya.
Secara keseluruhan, peningkatan GPT-4.5 dalam menangani pesan yang bertentangan adalah bagian dari peningkatan yang lebih luas dalam keselamatan, nuansa, dan kolaborasi, membuatnya lebih efektif dalam mempertahankan interaksi yang aman dan tepat [1] [3].
Kutipan:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-Explained-everything-you-need-to-now
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-they-compare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5-emotically-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-hould-now-about-tanggar-den-dan-baru
[7] https://ventureBeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/