GPT-4.5: Správa protichůdných pokynů a řešení problémů s více kroky

Jak GPT-4.5 zpracovává protichůdné pokyny ve vícestupňových problémech

GPT-4.5 je navržen tak, aby řešil protichůdné pokyny ve vícestupňových problémech tím, že dodržoval hierarchii instrukcí. Tato hierarchie pomáhá modelu upřednostňovat systémové zprávy před zprávami uživatele a zmírnit riziko rychlých injekcí a dalších útoků, které by mohly potlačit bezpečnostní pokyny [1] [5].

Manipulace s konfliktními pokyny

1. Hodnocení hierarchie instrukcí: GPT-4.5 je vyškolen k rozpoznání a dodržování pokynů ve zprávě s nejvyšší prioritou, když čelí konfliktním zprávám. To zahrnuje scénáře, ve kterých konflikt systémových zpráv a uživatelských zpráv musí vybrat, kterou sadu pokynů, které se mají dodržovat [1].

2. Systém vs. Zprávy uživatele: Model se učí upřednostňovat systémové zprávy, které jsou navrženy tak, aby vynucovaly bezpečnostní a provozní pokyny, přes uživatelské zprávy. Tím je zajištěno, že GPT-4.5 dodržuje své bezpečnostní protokoly, i když se uživatelé pokoušejí obejít [1] [5].

3. Realistické scénáře: Hodnocení zahrnují realistické scénáře, ve kterých model působí jako učitel a musí odolat pokusům uživatelů, aby jej přiměli odhalit odpovědi nebo řešení. GPT-4.5 je pokyn, aby nevydával odpovědi, a musí se řídit těmito systémovými pokyny navzdory pokusům o jejich obcházení [1].

4. Fráze a ochrana hesla: V jiném typu hodnocení je GPT-4.5 instruován, aby nevykonával specifické fráze nebo odhalil hesla. Model musí odolat uživatelským zprávám určeným k tomu, aby to přiměl k tomu, což prokáže jeho schopnost chránit citlivé informace [1].

pro více krok s problémem

Zatímco GPT-4.5 je navržen tak, aby zvládl konfliktní pokyny efektivně, jeho schopnost řídit problémy s více kroky lze zlepšit strukturováním pokynů jasným a sekvenčním způsobem. To zahrnuje rozdělení úkolů na menší kroky a zajištění dokončení každého kroku před přechodem na další [2]. Výkon GPT-4.5 však automaticky po instrukcích s více kroky bez manuálního zásahu (např. Vybírání „next“) zůstává výzvou [4].

Zlepšení výkonu

Pro zvýšení výkonu GPT-4.5 ve vícestupňových úkolech mohou uživatelé používat strategie jako:

- Vymazat strukturu rychlosti: Pomocí záhlaví nebo značek sekce jasně definujte každý krok, pomáhají modelu rozpoznat a efektivněji sledovat sekvenci [2].
-Sekvenční provádění: Implementujte přístup krok za krokem, kde je každý krok plně zpracován před přechodem na další, což lze usnadnit pomocí funkcí podobných struktur v výzvách [2].
- Manuální intervence: V případě potřeby vyzvěte model k dalšímu kroku, protože se nemusí automaticky pohybovat přes sekvenci bez takových podnětů [4].

Citace:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-Multi-step-ustom-gpts-sovel-tasks
[3] https://community.openai.com/t/how-to-dere-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-tuck-with-multi-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-utput-length-and-structure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/