GPT-4.5 демонструє конкретні вдосконалення щодо GPT-4O у обробці суперечливих повідомлень через його розширену ієрархію інструкцій. Ця функція дозволяє моделі визначати пріоритетні системні повідомлення перед повідомленнями користувачів, зменшуючи ризик оперативних ін'єкцій та інших атак, які можуть перекрити інструкції з безпеки. Ось ключові вдосконалення:
1. Це допомагає моделі краще обробляти сценарії, коли входи користувачів можуть спробувати обходити протоколи безпеки.
2. Резолюція конфліктів: GPT-4.5, як правило, перевершує GPT-4O в оцінках, що включають конфлікти між системою та повідомленнями користувачів. Це вдосконалення має вирішальне значення для підтримки безпеки та дотримання керівних принципів у складних розмовних сценаріях.
3. Репетитор-джейлбрейк: У конкретному сценарії, коли модель виступає в якості репетитора з математики, GPT-4.5 доручено не розкривати відповідь на математичне запитання. Хоча GPT-4.5 не перевершує GPT-4O в цій конкретній оцінці (точність GPT-4O вища), він все ще демонструє надійність у протистоянні спробам її надання несанкціонованої інформації.
4. Захист фрази та пароля: GPT-4.5 показує потужну продуктивність у захисті конкретних фраз чи паролів від розкриття за допомогою підказок користувача. Це вказує на кращу здатність підтримувати конфіденційність та дотримуватися рекомендацій щодо безпеки порівняно з деякими попередніми моделями.
Загалом, вдосконалення GPT-4.5 у обробці суперечливих повідомлень є частиною його більш широких покращень у безпеці, нюансах та співпраці, що робить його більш ефективним у підтримці безпечних та відповідних взаємодій [1] [3].
Цитати:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4oexplained-everything-you-need-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-compare
[5] https://www.businessinsider.com/openai-sam-altman-relases-gpt-4-5-emotional-intelligent-model-2025-2
4
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/