Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Que melhorias específicas o GPT-4.5 tem sobre o GPT-4o no lidar com mensagens conflitantes


Que melhorias específicas o GPT-4.5 tem sobre o GPT-4o no lidar com mensagens conflitantes


O GPT-4.5 demonstra melhorias específicas em relação ao GPT-4O no lidar com mensagens conflitantes por meio de sua hierarquia aprimorada de instruções. Esse recurso permite que o modelo priorize as mensagens do sistema sobre as mensagens do usuário, mitigando o risco de injeções rápidas e outros ataques que podem substituir as instruções de segurança. Aqui estão as principais melhorias:

1. Avaliação da hierarquia de instruções: nas avaliações em que diferentes tipos de mensagens entram em conflito, o GPT-4.5 é treinado para seguir as instruções na mensagem de maior prioridade. Isso ajuda o modelo a lidar melhor com cenários em que as entradas do usuário podem tentar ignorar os protocolos de segurança.

2. Resolução de conflitos: o GPT-4.5 geralmente supera o GPT-4O em avaliações que envolvem conflitos entre o sistema e as mensagens do usuário. Essa melhoria é crucial para manter a segurança e a adesão às diretrizes em cenários de conversação complexos.

3. Jailbreaks do tutor: Em um cenário específico em que o modelo atua como tutor de matemática, o GPT-4.5 é instruído a não revelar a resposta a uma pergunta de matemática. Embora o GPT-4.5 não supere o GPT-4O nessa avaliação específica (a precisão do GPT-4O é maior), ele ainda demonstra robustez em resistir a tentativas de induzi-lo a fornecer informações não autorizadas.

4. Phrase e Proteção de senha: GPT-4.5 mostra um forte desempenho na proteção de frases ou senhas específicas de serem reveladas por meio de prompts do usuário. Isso indica uma melhor capacidade de manter a confidencialidade e aderir às diretrizes de segurança em comparação com alguns modelos anteriores.

No geral, as melhorias do GPT-4.5 no lidar com mensagens conflitantes fazem parte de seus aprimoramentos mais amplos em segurança, nuances e colaboração, tornando-o mais eficaz na manutenção de interações seguras e apropriadas [1] [3].

Citações:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explined- everything-you-need-to-know
[3] https://openai.com/index/introducting-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-hey-comparpare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5- emotionalmente-intelligente-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-hould-abnow-about-the update-and-new--Tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/