GPT-4.5: Gestione delle istruzioni contrastanti e risoluzione dei problemi in più fasi

In che modo GPT-4.5 gestisce le istruzioni contrastanti nei problemi a più fasi

GPT-4.5 è progettato per gestire istruzioni contrastanti in problemi a più fasi aderendo a una gerarchia di istruzioni. Questa gerarchia aiuta il modello a dare la priorità ai messaggi di sistema sui messaggi dell'utente, mitigando il rischio di iniezioni rapide e altri attacchi che potrebbero prevalere sulle istruzioni di sicurezza [1] [5].

Gestione delle istruzioni in conflitto

1. Valutazione della gerarchia delle istruzioni: GPT-4.5 è addestrato a riconoscere e seguire le istruzioni nel messaggio di priorità più alta di fronte a messaggi contrastanti. Ciò include scenari in cui i messaggi di sistema e i messaggi utente sono in conflitto e il modello deve scegliere quale set di istruzioni da seguire [1].

2. Sistema vs. Messaggi utente: viene insegnato il modello a dare priorità ai messaggi di sistema, progettati per far rispettare le linee guida di sicurezza e operative, sui messaggi dell'utente. Ciò garantisce che GPT-4.5 aderisca ai suoi protocolli di sicurezza anche quando gli utenti tentano di aggirarli [1] [5].

3. Scenari realistici: le valutazioni includono scenari realistici in cui il modello funge da tutor e deve resistere ai tentativi degli utenti di ingannare le risposte o le soluzioni. GPT-4.5 è incaricato di non dare risposte e deve seguire queste istruzioni del sistema nonostante i tentativi dell'utente di aggirarle [1].

4. Frase e protezione da password: in un altro tipo di valutazione, GPT-4.5 è incaricato di non produrre frasi specifiche o rivelare password. Il modello deve resistere ai messaggi utente progettati per indurlo a farlo, dimostrando la sua capacità di proteggere le informazioni sensibili [1].

gestione dei problemi in più fasi

Mentre GPT-4.5 è progettato per gestire efficacemente le istruzioni contrastanti, la sua capacità di gestire i problemi in più fasi può essere migliorata strutturando i prompt in modo chiaro e sequenziale. Ciò comporta la rottura delle attività in passaggi più piccoli e la garanzia di completare ogni passaggio prima di passare al successivo [2]. Tuttavia, le prestazioni di GPT-4.5 nel seguire automaticamente le istruzioni a più fasi senza intervento manuale (ad esempio, spingere "successivo") rimane una sfida [4].

Miglioramento delle prestazioni

Per migliorare le prestazioni di GPT-4.5 in attività in più fasi, gli utenti possono utilizzare strategie come:

- Struttura del prompt chiaro: utilizzare intestazioni o marcatori di sezione per definire chiaramente ogni passaggio, aiutando il modello a riconoscere e seguire la sequenza in modo più efficace [2].
-Esecuzione sequenziale: implementa un approccio passo-passo in cui ogni passaggio è completamente elaborato prima di passare al successivo, che può essere facilitato utilizzando strutture simili a funzioni nelle prompt [2].
- Intervento manuale: se necessario, spingere manualmente il modello a procedere al passaggio successivo, in quanto potrebbe non muoversi automaticamente attraverso una sequenza senza tali segnali [4].

Citazioni:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-peps-to-build-multi-step-custom-gpts --setsks
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-strutture/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/