Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuinka GPT-4.5 käsittelee ristiriitaisia ​​ohjeita monivaiheisissa ongelmissa


Kuinka GPT-4.5 käsittelee ristiriitaisia ​​ohjeita monivaiheisissa ongelmissa


GPT-4.5 on suunniteltu käsittelemään ristiriitaisia ​​ohjeita monivaiheisissa ongelmissa noudattamalla ohjehierarkiaa. Tämä hierarkia auttaa mallia priorisoimaan järjestelmäviestejä käyttäjäviesteihin, lieventämään nopean injektion ja muiden hyökkäysten riskiä, ​​jotka saattavat ohittaa turvallisuusohjeet [1] [5].

Ristiriitaisten ohjeiden käsittely

1. Ohjeiden hierarkian arviointi: GPT-4.5 on koulutettu tunnistamaan ja noudattamaan ohjeita ensisijaisessa viestissä ristiriitaisten viestien kohdalla. Tämä sisältää skenaariot, joissa järjestelmäviestit ja käyttäjäviestit ovat ristiriidassa, ja mallin on valittava, mitä ohjeita noudatetaan [1].

2. Järjestelmä vs. Käyttäjäviestit: Malli opetetaan priorisoimaan järjestelmäviestit, jotka on suunniteltu turvallisuus- ja toimintaohjeiden valvomiseksi käyttäjäviesteissä. Tämä varmistaa, että GPT-4,5 noudattaa turvallisuusprotokolliaan myös silloin, kun käyttäjät yrittävät ohittaa ne [1] [5].

3. Realistiset skenaariot: Arviointeihin sisältyy realistisia skenaarioita, joissa malli toimii ohjaajana, ja sen on vastustettava käyttäjien yrityksiä huijata se paljastamaan vastauksia tai ratkaisuja. GPT-4.5 kehotetaan olemaan antamatta vastauksia, ja sen on noudatettava näitä järjestelmäohjeita huolimatta käyttäjän yrityksistä kiertää niitä [1].

4. Lause ja salasanan suojaus: Toisessa arvioinnissa GPT-4.5 kehotetaan olemaan lähettämättä tiettyjä lauseita tai paljastamaan salasanoja. Mallin on vastustettava käyttäjäviestejä, jotka on suunniteltu huijaamaan sitä tekemään niin, osoittaen sen kyvyn suojata arkaluontoisia tietoja [1].

Monivaiheinen ongelmankäsittely

Vaikka GPT-4.5 on suunniteltu käsittelemään ristiriitaisia ​​ohjeita tehokkaasti, sen kykyä hallita monivaiheista ongelmia voidaan parantaa jäsentämällä kehotuksia selkeällä, peräkkäisellä tavalla. Tähän sisältyy tehtävien jakaminen pienempiin vaiheisiin ja varmistaa, että jokainen vaihe on valmis ennen siirtymistä seuraavaan [2]. GPT-4.5: n suorituskyky automaattisesti monivaiheisten ohjeiden seurauksena ilman manuaalista interventiota (esim. "Seuraava") on kuitenkin haaste [4].

Suorituskyvyn parantaminen

GPT-4.5: n suorituskyvyn parantamiseksi monivaiheisissa tehtävissä käyttäjät voivat käyttää strategioita, kuten:

- Selkeä nopea rakenne: Käytä otsikoita tai osiomerkkejä määritelläksesi jokaisen vaiheen selvästi, auttaen mallia tunnistamaan ja seuraamaan sekvenssiä tehokkaammin [2].
-Sekvenssien suorittaminen: Toteuta vaiheittainen lähestymistapa, jossa jokainen vaihe on täysin käsitelty ennen siirtymistä seuraavaan, jota voidaan helpottaa kehotuksissa toimintonkaltaisia ​​rakenteita [2].
- Manuaalinen interventio: tarvittaessa kehottaa malli manuaalisesti siirtymään seuraavaan vaiheeseen, koska se ei välttämättä liiku automaattisesti sekvenssin läpi ilman tällaisia ​​vihjeitä [4].

Viittaukset:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
.
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
.
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/