GPT-4.5 on suunniteltu käsittelemään ristiriitaisia ohjeita monivaiheisissa ongelmissa noudattamalla ohjehierarkiaa. Tämä hierarkia auttaa mallia priorisoimaan järjestelmäviestejä käyttäjäviesteihin, lieventämään nopean injektion ja muiden hyökkäysten riskiä, jotka saattavat ohittaa turvallisuusohjeet [1] [5].
Ristiriitaisten ohjeiden käsittely
1. Ohjeiden hierarkian arviointi: GPT-4.5 on koulutettu tunnistamaan ja noudattamaan ohjeita ensisijaisessa viestissä ristiriitaisten viestien kohdalla. Tämä sisältää skenaariot, joissa järjestelmäviestit ja käyttäjäviestit ovat ristiriidassa, ja mallin on valittava, mitä ohjeita noudatetaan [1].
2. Järjestelmä vs. Käyttäjäviestit: Malli opetetaan priorisoimaan järjestelmäviestit, jotka on suunniteltu turvallisuus- ja toimintaohjeiden valvomiseksi käyttäjäviesteissä. Tämä varmistaa, että GPT-4,5 noudattaa turvallisuusprotokolliaan myös silloin, kun käyttäjät yrittävät ohittaa ne [1] [5].
3. Realistiset skenaariot: Arviointeihin sisältyy realistisia skenaarioita, joissa malli toimii ohjaajana, ja sen on vastustettava käyttäjien yrityksiä huijata se paljastamaan vastauksia tai ratkaisuja. GPT-4.5 kehotetaan olemaan antamatta vastauksia, ja sen on noudatettava näitä järjestelmäohjeita huolimatta käyttäjän yrityksistä kiertää niitä [1].
4. Lause ja salasanan suojaus: Toisessa arvioinnissa GPT-4.5 kehotetaan olemaan lähettämättä tiettyjä lauseita tai paljastamaan salasanoja. Mallin on vastustettava käyttäjäviestejä, jotka on suunniteltu huijaamaan sitä tekemään niin, osoittaen sen kyvyn suojata arkaluontoisia tietoja [1].
Monivaiheinen ongelmankäsittely
Vaikka GPT-4.5 on suunniteltu käsittelemään ristiriitaisia ohjeita tehokkaasti, sen kykyä hallita monivaiheista ongelmia voidaan parantaa jäsentämällä kehotuksia selkeällä, peräkkäisellä tavalla. Tähän sisältyy tehtävien jakaminen pienempiin vaiheisiin ja varmistaa, että jokainen vaihe on valmis ennen siirtymistä seuraavaan [2]. GPT-4.5: n suorituskyky automaattisesti monivaiheisten ohjeiden seurauksena ilman manuaalista interventiota (esim. "Seuraava") on kuitenkin haaste [4].
Suorituskyvyn parantaminen
GPT-4.5: n suorituskyvyn parantamiseksi monivaiheisissa tehtävissä käyttäjät voivat käyttää strategioita, kuten:
- Selkeä nopea rakenne: Käytä otsikoita tai osiomerkkejä määritelläksesi jokaisen vaiheen selvästi, auttaen mallia tunnistamaan ja seuraamaan sekvenssiä tehokkaammin [2].
-Sekvenssien suorittaminen: Toteuta vaiheittainen lähestymistapa, jossa jokainen vaihe on täysin käsitelty ennen siirtymistä seuraavaan, jota voidaan helpottaa kehotuksissa toimintonkaltaisia rakenteita [2].
- Manuaalinen interventio: tarvittaessa kehottaa malli manuaalisesti siirtymään seuraavaan vaiheeseen, koska se ei välttämättä liiku automaattisesti sekvenssin läpi ilman tällaisia vihjeitä [4].
Viittaukset:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
.
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
.
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/