GPT-4.5: Управління суперечливими інструкціями та багатоетапним вирішенням проблем

GPT-4.5 призначений для вирішення суперечливих інструкцій у багатоетапних проблемах, дотримуючись ієрархії інструкцій. Ця ієрархія допомагає моделі визначити пріоритети системних повідомлень над повідомленнями користувачів, зменшуючи ризик оперативних ін'єкцій та інших атак, які можуть змінити інструкції з безпеки [1] [5].

Поводження з конфліктними інструкціями

1. Сюди входять сценарії, де конфлікти системних повідомлень та повідомлення користувачів, а модель повинна вибрати, який набір інструкцій слід дотримуватися [1].

2. Система проти повідомлень користувачів: Модель навчається визначати пріоритетні системні повідомлення, розроблені для виконання правил безпеки та експлуатації над повідомленнями користувачів. Це гарантує, що GPT-4.5 дотримується своїх протоколів безпеки навіть тоді, коли користувачі намагаються обійти їх [1] [5].

3. Реалістичні сценарії: Оцінки включають реалістичні сценарії, де модель виступає репетитором і повинна протистояти спробам користувачів обдурити її у розкритті відповідей чи рішень. GPT-4.5 доручено не давати відповіді, і він повинен дотримуватися цих системних інструкцій, незважаючи на спроби користувача обійти їх [1].

. Модель повинна протистояти повідомленням користувачів, розробленим для того, щоб обдурити це, демонструючи свою здатність захищати конфіденційну інформацію [1].

Multi-STEP

Незважаючи на те, що GPT-4.5 призначений для ефективного поводження з конфліктними інструкціями, його здатність керувати багатоетапними проблемами можна вдосконалити шляхом структурування підказок чітко, послідовно. Це передбачає порушення завдань на менші кроки та забезпечення завершення кожного кроку перед переходом до наступного [2]. Однак продуктивність GPT-4.5 в автоматично дотримуючись багатоетапних інструкцій без ручного втручання (наприклад, підказка "наступного") залишається викликом [4].

Удосконалення ефективності

Для підвищення продуктивності GPT-4.5 у багатоетапних завданнях користувачі можуть використовувати такі стратегії, як:

- Чітка структура підказки: Використовуйте заголовки або маркери розділів, щоб чітко визначити кожен крок, допомагаючи моделі розпізнати та більш ефективно дотримуватися послідовності [2].
-Послідовне виконання: Реалізуйте покроковий підхід, коли кожен крок повністю обробляється перед переходом до наступного, який можна полегшити за допомогою функціональних структур у підказках [2].
- Ручне втручання: Якщо необхідно, вручну спонукає модель перейти до наступного кроку, оскільки вона може не автоматично проходити через послідовність без таких сигналів [4].

Цитати:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve-tasks
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/

Як GPT-4.5 обробляє суперечливі інструкції в багатоетапних проблемах

Поводження з конфліктними інструкціями

Multi-STEP

Удосконалення ефективності