Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon GPT-4.5가 충돌하는 메시지를 처리 ​​할 때 GPT-4O 이상의 구체적인 개선 사항


GPT-4.5가 충돌하는 메시지를 처리 ​​할 때 GPT-4O 이상의 구체적인 개선 사항


GPT-4.5는 강화 된 명령 계층을 통해 충돌하는 메시지를 처리 ​​할 때 GPT-4O에 비해 구체적인 개선을 보여줍니다. 이 기능을 사용하면 모델이 사용자 메시지보다 시스템 메시지를 우선 순위로 정리하여 안전 지침을 무시할 수있는 신속한 주입 및 기타 공격의 위험을 완화 할 수 있습니다. 주요 개선 사항은 다음과 같습니다.

1. 지시 계층 구조 평가 : 다양한 유형의 메시지가 서로 충돌하는 평가에서 GPT-4.5는 최고 우선 순위 메시지의 지침을 따르도록 교육을받습니다. 이를 통해 모델이 사용자 입력이 안전 프로토콜을 우회하려고 시도 할 수있는 시나리오를 더 잘 처리하는 데 도움이됩니다.

2. 충돌 해결 : GPT-4.5는 일반적으로 시스템과 사용자 메시지 간의 충돌과 관련된 평가에서 GPT-4O보다 성능이 우수합니다. 이러한 개선은 복잡한 대화 시나리오에서 안전을 유지하고 지침을 준수하는 데 중요합니다.

3. 교사 탈옥 : 모델이 수학 교사 역할을하는 특정 시나리오에서 GPT-4.5는 수학 질문에 대한 답을 밝히지 말라고 지시합니다. GPT-4.5는이 특정 평가에서 GPT-4O를 능가하지 않지만 (GPT-4O의 정확도는 높음) 여전히 무단 정보를 제공하는 데 속이는 시도에 저항하는 데 견고성을 보여줍니다.

4. 문구 및 비밀번호 보호 : GPT-4.5는 사용자 프롬프트를 통해 특정 문구 나 비밀번호를 공개하지 않도록 강력한 성능을 보여줍니다. 이는 일부 이전 모델에 비해 기밀성을 유지하고 보안 지침을 준수하는 더 나은 능력을 나타냅니다.

전반적으로, 충돌하는 메시지를 처리하는 GPT-4.5의 개선은 안전, 뉘앙스 및 협업의 광범위한 향상의 일부로 안전하고 적절한 상호 작용을 유지하는 데 더 효과적입니다 [1] [3].

인용 :
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explained-every-need-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-they-compare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5-emotionally-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4-all-you--should-hould-should-the-update-and-tools
[7] https://venturebeat.com/ai/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188T13H/GPT4_HAS_A_LIMIT_OF_40_MESSAGES3_HOURS_NOW/