GPT-4.5: Gerenciando instruções conflitantes e resolução de problemas em várias etapas

Como o GPT-4.5 lida com instruções conflitantes em problemas de várias etapas

O GPT-4.5 foi projetado para lidar com instruções conflitantes em problemas de várias etapas, aderindo a uma hierarquia de instruções. Essa hierarquia ajuda o modelo a priorizar as mensagens do sistema sobre as mensagens do usuário, mitigando o risco de injeções rápidas e outros ataques que podem substituir as instruções de segurança [1] [5].

lidando com instruções conflitantes

1. Avaliação da hierarquia de instruções: o GPT-4.5 é treinado para reconhecer e seguir as instruções na mensagem de prioridade mais alta quando confrontado com mensagens conflitantes. Isso inclui cenários em que as mensagens do sistema e as mensagens do usuário conflitam, e o modelo deve escolher qual conjunto de instruções a seguir [1].

2. Sistema vs. mensagens do usuário: O modelo é ensinado a priorizar as mensagens do sistema, projetadas para aplicar diretrizes de segurança e operacionais, sobre mensagens do usuário. Isso garante que o GPT-4.5 adere aos seus protocolos de segurança, mesmo quando os usuários tentam ignorá-los [1] [5].

3. Cenários realistas: as avaliações incluem cenários realistas em que o modelo atua como um tutor e deve resistir às tentativas dos usuários de induzi -lo a revelar respostas ou soluções. O GPT-4.5 é instruído a não dar respostas e deve seguir essas instruções do sistema, apesar das tentativas do usuário para contorná-las [1].

4. Frase e proteção de senha: em outro tipo de avaliação, o GPT-4.5 é instruído a não produzir frases específicas ou revelar senhas. O modelo deve resistir às mensagens do usuário projetadas para enganá -lo, demonstrando sua capacidade de proteger informações confidenciais [1].

Manipulação de problemas com vários step

Embora o GPT-4.5 seja projetado para lidar com instruções conflitantes de maneira eficaz, sua capacidade de gerenciar problemas em várias etapas pode ser melhorada, estruturando os prompts de maneira clara e seqüencial. Isso envolve dividir tarefas em etapas menores e garantir que cada etapa seja concluído antes de passar para o próximo [2]. No entanto, o desempenho do GPT-4.5 em automaticamente após instruções em várias etapas sem intervenção manual (por exemplo, provocar "Next") continua sendo um desafio [4].

melhorando o desempenho

Para aprimorar o desempenho do GPT-4.5 em tarefas de várias etapas, os usuários podem empregar estratégias como:

- Estrutura rápida clara: use cabeçalhos ou marcadores de seção para definir claramente cada etapa, ajudando o modelo a reconhecer e seguir a sequência de maneira mais eficaz [2].
-Execução seqüencial: implemente uma abordagem passo a passo, onde cada etapa é totalmente processada antes de passar para a próxima, que pode ser facilitada usando estruturas semelhantes a funções em prompts [2].
- Intervenção manual: se necessário, solicite manualmente o modelo a prosseguir para a próxima etapa, pois pode não se mover automaticamente através de uma sequência sem tais pistas [4].

Citações:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed steps-to-build-multi-teppom-custom-gpts-solve-tasks
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-sep-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/