GPT-4.5 je zasnovan tako, da obravnava nasprotujoča si navodila pri večstopenjskih težavah z upoštevanjem hierarhije navodil. Ta hierarhija pomaga modelu prednostno določiti sistemska sporočila nad uporabniškimi sporočili, kar ublaži tveganje za hitre injekcije in druge napade, ki bi lahko preglasili varnostna navodila [1] [5].
Ravnanje z nasprotujočimi si navodili
1. Ocenjevanje hierarhije navodil: GPT-4.5 je usposobljen za prepoznavanje in upoštevanje navodil v najvišjem prednostnem sporočilu, ko se sooča z nasprotujočimi si sporočili. To vključuje scenarije, v katerih sistemska sporočila in uporabniška sporočila konflikta, in model mora izbrati, kateri niz navodil je treba upoštevati [1].
2. Sistem proti uporabniškim sporočilom: Model je poučen, da prednostno določi sistemska sporočila, ki so zasnovana za uveljavitev varnostnih in operativnih smernic prek uporabniških sporočil. To zagotavlja, da se GPT-4.5 drži svojih varnostnih protokolov, tudi ko jih uporabniki poskušajo zaobiti [1] [5].
3. Realistični scenariji: Ocene vključujejo realistične scenarije, kjer model deluje kot mentor in se mora upreti poskusom uporabnikov, da ga preganjajo v razkrivanje odgovorov ali rešitev. GPT-4.5 je navodilo, naj ne daje odgovorov, zato mora slediti tem sistemskim navodilom, kljub poskusom, da jih uporabnik zaobide [1].
4. Zaščita besedne zveze in gesla: V drugi vrsti ocenjevanja je GPT-4.5 Naročen, da ne oddaja določenih stavkov ali razkrije gesel. Model se mora upreti uporabniškim sporočilom, namenjenimi temu, da to privabi pri tem, kar kaže na njegovo sposobnost zaščite občutljivih informacij [1].
Ravnanje z večstopenjskimi težavami
Medtem ko je GPT-4.5 zasnovan tako, da učinkovito obravnava nasprotujoča si navodila, je mogoče njegovo sposobnost upravljanja z večstopenjskimi težavami izboljšati s strukturiranjem pozivov na jasen, zaporedno. To vključuje razbijanje nalog v manjše korake in zagotovitev, da se vsak korak zaključi, preden se premaknete na naslednje [2]. Vendar uspešnost GPT-4.5 samodejno po večstopenjskih navodilih brez ročnega intervencije (npr. Poziva "naslednji") ostaja izziv [4].
Izboljšanje zmogljivosti
Za izboljšanje uspešnosti GPT-4.5 pri večstopenjskih nalogah lahko uporabniki uporabijo strategije, kot so:
- Jasna hitrost: uporabite glave ali označevalce odsekov, da jasno določite vsak korak, pri čemer model pomagate prepoznati in učinkoviteje slediti zaporedju [2].
-Zaporedna izvedba: Izvedite pristop po korakih, kjer je vsak korak v celoti obdelan, preden se premaknete na naslednjo, kar je mogoče olajšati z uporabo funkcijskih struktur v pozivih [2].
- Ročni intervencija: Če je potrebno, ročno pozove modela, da nadaljuje do naslednjega koraka, saj se ne sme samodejno premakniti skozi zaporedje brez takšnih znakov [4].
Navedbe:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-molti-tep-custom-gpts-solve
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-moulti-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1IZN175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-Length-and-sucture/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exm/gpt4_has_only_been_getting_worse/