GPT-4.5旨在通过遵守指令层次结构来处理多步问题中的冲突指令。该层次结构有助于模型优先考虑系统消息而不是用户消息,从而减轻了可能覆盖安全指令的迅速注射风险和其他攻击的风险[1] [5]。
###处理冲突的说明
1。指令层次结构评估:GPT-4.5经过培训,可以在面对冲突的消息时识别并遵循最高优先级消息中的说明。这包括系统消息和用户消息冲突的方案,模型必须选择要遵循的一组指令[1]。
2.系统与用户消息:教导模型以优先考虑系统消息,这些消息旨在通过用户消息来执行安全和操作指南。这样可以确保GPT-4.5即使用户试图绕过它们也遵守其安全协议[1] [5]。
3。现实的场景:评估包括现实的场景,其中该模型充当导师,并且必须抗拒用户尝试欺骗其以揭示答案或解决方案的尝试。 GPT-4.5被指示不给出答案,尽管用户试图绕过它们,但必须遵循这些系统说明[1]。
4。短语和密码保护:在另一种类型的评估中,GPT-4.5被指示不要输出特定短语或显示密码。该模型必须抗拒旨在欺骗其这样做的用户消息,以证明其保护敏感信息的能力[1]。
###多步问题处理
虽然GPT-4.5旨在有效地处理冲突指令,但通过以清晰的,顺序的方式构造提示可以改善其管理多步问题的能力。这涉及将任务分为较小的步骤,并确保在移至下一个[2]之前完成每个步骤。但是,GPT-4.5在不手动干预的情况下自动遵循多步说明(例如提示“下一个”)的性能仍然是一个挑战[4]。
###提高性能
为了提高GPT-4.5在多步骤任务中的性能,用户可以采用以下策略:
- 清晰的提示结构:使用标题或截面标记清楚地定义每个步骤,帮助模型更有效地识别并遵循序列[2]。
- 顺序执行:实现一个逐步的方法,在移动下一个步骤之前,每个步骤都已完全处理,可以通过提示中使用类似功能的结构来促进[2]。
- 手动干预:如有必要,请手动提示模型继续下一步,因为它可能不会在没有此类提示的情况下自动通过序列移动[4]。
引用:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve-stasks
[3] https://community.openai.com/t/how-to-deal-with-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-to-mimprove-gpt-4-api-unput-length-and-scruce/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197Exmm/gpt4_has_has_has_only_been_getting_getting_worse/