GPT-4.5: управление конфликтующими инструкциями и многоэтапным решением проблем

GPT-4.5 предназначен для обработки противоречивых инструкций в многоэтапных задачах, придерживаясь иерархии инструкций. Эта иерархия помогает модели определять приоритеты системных сообщений над сообщениями пользователей, смягчая риск быстрых инъекций и других атак, которые могут переопределить инструкции по безопасности [1] [5].

Обработка противоречивых инструкций

1. Оценка иерархии инструкций: GPT-4.5 обучается распознавать и следовать инструкциям в сообщении с наивысшим приоритетом, когда сталкивается с противоречивыми сообщениями. Это включает в себя сценарии, в которых системные сообщения и сообщения пользователей конфликтуют, и модель должна выбрать, какой набор инструкций следует следовать [1].

2. Система против сообщений пользователя: модель учат определять приоритеты системных сообщений, которые предназначены для обеспечения соблюдения руководящих принципов безопасности и эксплуатации над сообщениями пользователя. Это гарантирует, что GPT-4.5 придерживается своих протоколов безопасности, даже когда пользователи пытаются обойти их [1] [5].

3. Реалистичные сценарии: Оценки включают реалистичные сценарии, в которых модель действует как репетитор и должна сопротивляться попыткам пользователей обмануть его в раскрывающих ответах или решениях. GPT-4.5 поручено не отдавать ответы, и он должен следовать этим системным инструкциям, несмотря на попытки пользователя обойти их [1].

4. Фраза и защита пароля: в другом типе оценки GPT-4.5 инструментаруется не выводить конкретные фразы и не раскрывать пароли. Модель должна противостоять сообщениям пользователей, предназначенных для того, чтобы обмануть это в этом, демонстрируя его способность защищать конфиденциальную информацию [1].

многоэтапная задача задачи

В то время как GPT-4.5 предназначен для эффективного обращения с конфликтующими инструкциями, его способность управлять многоэтапными задачами может быть улучшена путем структурирования подсказок четким, последовательным образом. Это включает в себя нарушение задач на более мелкие шаги и обеспечение завершения каждого шага, прежде чем перейти к следующему [2]. Тем не менее, производительность GPT-4.5 в автоматическом порядке по многоэтапным инструкциям без ручного вмешательства (например, подсказка «Далее») остается проблемой [4].

повышение производительности

Чтобы повысить производительность GPT-4.5 в многоэтапных задачах, пользователи могут использовать такие стратегии, как:

- Очищенная оперативная структура: используйте заголовки или маркеры раздела, чтобы четко определить каждый шаг, помогая модели распознавать и следовать последовательности более эффективно [2].
-Последовательное выполнение: реализуйте пошаговый подход, в котором каждый шаг полностью обрабатывается, прежде чем перейти к следующему, что может быть облегчено, используя функциональные структуры в подсказках [2].
- Ручное вмешательство: при необходимости вручную побуждает модель перейти к следующему шагу, так как она может не проходить через последовательность без таких сигналов [4].

Цитаты:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-tput-length-and-ructure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/

Как GPT-4.5 обрабатывает противоречивые инструкции в многоэтапных задачах

Обработка противоречивых инструкций

многоэтапная задача задачи

повышение производительности