GPT-4.5: Поліпшена продуктивність у обробці конфліктних інструкцій

Як порівнюється продуктивність GPT-4.5

GPT-4.5 демонструє покращену продуктивність у обробці суперечливих інструкцій порівняно з попередніми версіями, особливо завдяки його посиленій ієрархії навчання. Ця функція дозволяє моделі визначати пріоритет системних повідомлень над входами користувачів, пом'якшуючи ризики, пов'язані з оперативними ін'єкціями та іншими атаками, які можуть змінити інструкції з безпеки.

В оцінках, що стосуються суперечливих типів повідомлень, GPT-4.5, як правило, перевершує GPT-4O. Модель навчається дотримуватися інструкцій у повідомленні про найвищий пріоритет, що допомагає в сценаріях, коли системи систем та користувачів конфліктують. Наприклад, у сценарії, коли модель доручено не давати відповіді на математичне запитання, GPT-4.5 демонструє кращу дотримання цих інструкцій системи порівняно з GPT-4O, хоча він не перевершує GPT-4O1 у всіх оцінках [1].

Крім того, GPT-4.5 оцінювались у сценаріях, де він повинен захищати конкретні фрази чи паролі від розкриття за допомогою підказок користувача. У цих оцінках GPT-4.5 добре виконує, що вказує на його здатність підтримувати безпеку та дотримуватися інструкцій системи, навіть коли стикається з суперечливими вхідами користувачів [1].

Однак, хоча GPT-4,5 вдосконалюється на попередніх моделях у обробці суперечливих інструкцій, він все ще стикається з проблемами в певних складних сценаріях. Продуктивність моделі в червоних оцінках команд, які імітують змагальні спонукання, показує, що вона може створювати небезпечні результати в деяких випадках, хоча вона, як правило, працює краще, ніж GPT-4O в цих складних тестах [1].

В цілому, вдосконалення GPT-4.5 в обробці суперечливих інструкцій роблять його більш надійним вибором для додатків, що вимагають суворого дотримання рекомендацій щодо безпеки та системних інструкцій.

Цитати:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-commared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_significanty_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-resoninging