GPT-4.5: Riadenie protichodných pokynov a viacstupňové riešenie problémov

Ako rieši GPT-4.5 protichodné pokyny vo viacerých krokoch

GPT-4,5 je navrhnutý tak, aby zvládal konfliktné pokyny vo viacstupňových problémoch tým, že dodržiava hierarchiu výučby. Táto hierarchia pomáha modelu uprednostňovať systémové správy pred používateľskými správami, čím sa zmierňuje riziko rýchlych injekcií a iných útokov, ktoré by mohli potlačiť bezpečnostné pokyny [1] [5].

manipulácia s protichodnými pokynmi

1. Vyhodnotenie hierarchie inštrukcií: GPT-4,5 je vyškolený na rozpoznávanie a postupovanie pokynov v správe s najvyššou prioritou, keď čelia protichodným správam. Zahŕňa to scenáre, v ktorých sú systémové správy a používateľské správy konfliktné a model si musí zvoliť, ktorá sada pokynov sa má riadiť [1].

2. Systém vs. Užívateľské správy: Model sa učí, aby uprednostňoval systémové správy, ktoré sú určené na presadzovanie bezpečnostných a prevádzkových pokynov pred používateľskými správami. To zaisťuje, že GPT-4,5 dodržiava svoje bezpečnostné protokoly, aj keď sa používatelia pokúšajú obísť [1] [5].

3. Realistické scenáre: Hodnotenia zahŕňajú realistické scenáre, v ktorých model pôsobí ako tútor a musí odolať pokusom používateľov, aby ho odhaľovali odhaľujúce odpovede alebo riešenia. GPT-4,5 je inštruovaný, aby neodovzdal odpovede, a musí sa riadiť týmito systémovými pokynmi napriek pokusom používateľa ich obísť [1].

4. Ochrana frázy a hesla: V inom type hodnotenia sa GPT-4,5 pokyn neučí, aby nevyrovnal špecifické frázy alebo neodhalil heslá. Model musí odolávať používateľským správam určeným na to, aby ich podviedol, a demonštruje jeho schopnosť chrániť citlivé informácie [1].

viacstupňové riešenie problémov

Zatiaľ čo GPT-4.5 je navrhnutý tak, aby efektívne zvládol konfliktné pokyny, jeho schopnosť zvládať viacstupňové problémy sa dá zlepšiť štruktúrovaním výziev jasným a sekvenčným spôsobom. Zahŕňa to rozdelenie úloh na menšie kroky a zabezpečenie dokončenia každého kroku pred presunutím na ďalší [2]. Výkon GPT-4.5 v automaticky nasledujúcom viacerých pokynoch bez manuálneho zásahu (napr. Podporovanie „Next“) však zostáva výzvou [4].

Zlepšenie výkonu

Aby sa zlepšil výkon GPT-4,5 pri viacstupňových úlohách, používatelia môžu používať stratégie, ako napríklad:

- Vymažte štruktúru postihnutia: Na jasné definovanie každého kroku použite hlavičky alebo markery sekcií, čo pomáha modelu rozpoznávať a efektívnejšie sledovať sekvenciu [2].
-Sekvenčné vykonávanie: Implementujte postupný prístup, kde je každý krok úplne spracovaný pred presunom na ďalší, čo sa dá uľahčiť pomocou funkčných štruktúr v výzvach [2].
- Manuálny zásah: Ak je to potrebné, manuálne vyzve model, aby pokračoval v ďalšom kroku, pretože sa nemusí automaticky pohybovať sekvenciou bez takýchto podnetov [4].

Citácie:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-Multi-tep-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-terput--dength-and-structure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/