GPT-4.5 er designet for å håndtere motstridende instruksjoner i flertrinnsproblemer ved å følge et instruksjonshierarki. Dette hierarkiet hjelper modellen med å prioritere systemmeldinger fremfor brukermeldinger, og avbøte risikoen for hurtig injeksjoner og andre angrep som kan overstyre sikkerhetsinstruksjoner [1] [5].
Håndtering av motstridende instruksjoner
1. Instruksjonshierarki Evaluering: GPT-4.5 er opplært til å gjenkjenne og følge instruksjonene i den høyeste prioriterte meldingen når du blir møtt med motstridende meldinger. Dette inkluderer scenarier der systemmeldinger og brukermeldinger er i konflikt, og modellen må velge hvilket sett med instruksjoner som skal følges [1].
2. System kontra brukermeldinger: Modellen læres å prioritere systemmeldinger, som er designet for å håndheve sikkerhets- og driftsretningslinjer, over brukermeldinger. Dette sikrer at GPT-4.5 holder seg til sikkerhetsprotokollene selv når brukere prøver å omgå dem [1] [5].
3. Realistiske scenarier: Evalueringer inkluderer realistiske scenarier der modellen fungerer som en veileder og må motstå forsøk fra brukere til å lure den til å avsløre svar eller løsninger. GPT-4.5 blir instruert om ikke å gi bort svar, og det må følge disse systeminstruksjonene til tross for brukerforsøk på å omgå dem [1].
4. Setnings- og passordbeskyttelse: I en annen type evaluering blir GPT-4.5 instruert om ikke å sende ut spesifikke setninger eller avsløre passord. Modellen må motstå brukermeldinger designet for å lure den til å gjøre det, og demonstrere dens evne til å beskytte sensitiv informasjon [1].
Multis-trinns problemhåndtering
Mens GPT-4.5 er designet for å håndtere motstridende instruksjoner effektivt, kan dens evne til å håndtere flertrinnsproblemer forbedres ved å strukturere spørsmål på en klar, sekvensiell måte. Dette innebærer å dele oppgaver i mindre trinn og sikre at hvert trinn er fullført før de flytter til neste [2]. Imidlertid er GPT-4.5s ytelse i automatisk flertrinns instruksjoner uten manuell intervensjon (f.eks. Å be om "neste") en utfordring [4].
Forbedre ytelsen
For å forbedre GPT-4.5s ytelse i flertrinnsoppgaver, kan brukere bruke strategier som:
- Klar hurtig struktur: Bruk overskrifter eller seksjonsmarkører for å tydelig definere hvert trinn, og hjelpe modellen til å gjenkjenne og følge sekvensen mer effektivt [2].
-Sekvensiell utførelse: Implementere en trinn-for-trinn-tilnærming der hvert trinn behandles fullt ut før de går til neste, noe som kan tilrettelegges ved å bruke funksjonsliknende strukturer i spørsmål [2].
- Manuell inngrep: Om nødvendig må manuelt be modellen om å gå videre til neste trinn, da den ikke automatisk beveger seg gjennom en sekvens uten slike signaler [4].
Sitasjoner:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solut-oppgaver
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_geting_worse/