GPT-4.5通过指令层次结构将系统消息优先于用户消息,旨在减轻迅速注射的风险和其他可能覆盖模型安全说明的攻击的风险。该层次结构将消息分类为两种主要类型:系统消息和用户消息。系统消息本质上是指导AI行为的隐藏指令,而用户消息是用户提供的输入。
在GPT-4.5中,当系统和用户消息冲突时,培训模型以遵循用户消息中的系统中的说明。这是通过在这些类型的消息发生冲突的示例中监督模型来实现的。该模型学会优先考虑系统消息,以确保遵守安全指南并防止不希望的输出。
例如,如果用户试图欺骗模型提供有害信息,则系统消息可以指示模型拒绝此类请求。 GPT-4.5遵守该层次结构的能力有助于维持安全标准,并防止模型被操纵到产生不允许的内容中。
这种方法对于确保GPT-4.5的行为与预期的安全和道德准则保持一致,即使面对通过巧妙精心制作的用户投入来绕开这些规则的情况,也是如此。通过优先考虑系统消息,OpenAI旨在增强模型在各种应用程序中的可靠性和安全性[1] [2]。
引用:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.prompthub.us/blog/everything-system-messages-how-to-use-use-them-real-real-world-xenperiments-prompt-prompt-prompt-infocty-tockition-Protectors
[3] https://platform.openai.com/docs/guides/prompt-engineering
[4] https://community.openai.com/t/whys-gpt-4o-insanely-imimited-to-free-free--users-and-even-plus-users-it-litellatel-letly-litersally-litely-barely-barely-gives-you-5-Messages-you-5-Messages-in-5-6小时至5-6小时the-the-the-the-the-the-the-the-the-free-users/769852/769852
[5] https://9meters.com/technology/ai/gpt-4-5-begins-rollings-rolling-to-plus-and-plus-and-team-users-next-week-to-enterprise-anderprise-anderprise-and-edu-users-pollowing-the-following-the-following-the-following-周
[6] https://arxiv.org/html/2408.10943v1
[7] https://www.pymnts.com/artcover-intelligence-2/2025/openai-to-release-gpt-4-5-within-within-within-weeks-gpt-gpt-5-within-months/
[8] https://www.reddit.com/r/chatgptpro/comments/13n55w7/highly_effidiced_prompt_for_summarizing_gpt4/