GPT-4.5 yra skirtas tvarkyti prieštaringas instrukcijas, susijusias su daugiapakopiais problemomis, laikantis instrukcijų hierarchijos. Ši hierarchija padeda modeliui nustatyti prioritetą sistemos pranešimams, o ne vartotojo pranešimams, sušvelninant greitų injekcijų ir kitų atakų, kurios gali nepaisyti saugos instrukcijų, riziką [1] [5].
prieštaringų instrukcijų tvarkymas
1. Instrukcijų hierarchijos vertinimas: GPT-4.5 mokomas atpažinti ir vykdyti instrukcijas aukščiausio prioritetinio pranešimo instrukcijose, kai susiduria su prieštaringais pranešimais. Tai apima scenarijus, kuriuose sistemos pranešimai ir vartotojo pranešimai prieštarauja, ir modelis turi pasirinkti, kurį instrukcijų rinkinį reikia laikytis [1].
2. Sistemos ir vartotojo pranešimai: Modelis mokomas nustatyti prioritetus sistemos pranešimams, kurie yra skirti užtikrinti saugos ir eksploatavimo gaires, o ne vartotojo pranešimus. Tai užtikrina, kad GPT-4.5 laikosi savo saugos protokolų net tada, kai vartotojai bando juos apeiti [1] [5].
3. Realistiški scenarijai: Įvertinimai apima realius scenarijus, kai modelis veikia kaip dėstytojas ir turi atsispirti vartotojų bandymams apgauti jį atskleidžiant atsakymus ar sprendimus. GPT-4.5 nurodoma neatsisakyti atsakymų, ir jis turi laikytis šių sistemos instrukcijų, nepaisant vartotojo bandymų jas apeiti [1].
4. Frazė ir slaptažodžio apsauga: Kitame vertinimo tipe GPT-4.5 nurodoma neišleisti konkrečių frazių ir neatskleisti slaptažodžių. Modelis turi atsispirti vartotojo pranešimams, skirtiems tai apgauti, tai pademonstruoti jo sugebėjimą apsaugoti neskelbtiną informaciją [1].
kelių žingsnių problemų tvarkymas
Nors GPT-4.5 yra skirtas efektyviai tvarkyti prieštaringas instrukcijas, jos sugebėjimą valdyti kelių žingsnių problemas galima patobulinti aiškiai ir nuosekliai. Tai apima užduotis į mažesnius žingsnius ir užtikrinant, kad kiekvienas žingsnis būtų atliktas prieš pereinant į kitą [2]. Tačiau GPT-4.5 našumas automatiškai laikantis kelių žingsnių instrukcijų be rankinės intervencijos (pvz., Raginimas „Kitas“) išlieka iššūkis [4].
Gerina našumą
Norėdami patobulinti GPT-4.5 našumą atliekant kelių žingsnių užduotis, vartotojai gali naudoti strategijas, tokias kaip:
- Išvalykite greitą struktūrą: Norėdami aiškiai apibrėžti kiekvieną žingsnį, naudokite antraštes arba skyrių žymeklius, padėdami modeliui atpažinti ir efektyviau sekti seką [2].
-Nuoseklus vykdymas: įgyvendinkite žingsnis po žingsnio metodą, kai kiekvienas žingsnis yra visiškai apdorotas prieš pereinant į kitą, o tai gali būti palengvinta naudojant funkcijų panašias struktūras raginimuose [2].
- Rankinė intervencija: jei reikia, rankiniu būdu paraginkite modelį pereiti prie kito veiksmo, nes jis gali automatiškai judėti per seką be tokių užuominų [4].
Citatos:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-sphole-to-build-multi-spust-custom-gpts-solve-taiks
[3] https://community.openai.com/t/hhow-to-deal-with Lazy-GPT-4/689286
[4] https://community.openai.com/t/gpt-getting-suck-with-multi-spht-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-outptpth-length-ntructure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/