Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hvilke spesifikke forbedringer har GPT-4.5 over GPT-4O i håndtering av motstridende meldinger


Hvilke spesifikke forbedringer har GPT-4.5 over GPT-4O i håndtering av motstridende meldinger


GPT-4.5 demonstrerer spesifikke forbedringer i forhold til GPT-4O i håndtering av motstridende meldinger gjennom det forbedrede instruksjonshierarkiet. Denne funksjonen gjør at modellen kan prioritere systemmeldinger fremfor brukermeldinger, og redusere risikoen for hurtig injeksjoner og andre angrep som kan overstyre sikkerhetsinstruksjoner. Her er de viktigste forbedringene:

1. Instruksjonshierarki Evaluering: I evalueringer der forskjellige typer meldinger er i konflikt med hverandre, er GPT-4.5 opplært til å følge instruksjonene i meldingen med høyeste prioritet. Dette hjelper modellen til å bedre håndtere scenarier der brukerinnganger kan forsøke å omgå sikkerhetsprotokoller.

2. Konfliktløsning: GPT-4.5 overgår generelt GPT-4O i evalueringer som involverer konflikter mellom system og brukermeldinger. Denne forbedringen er avgjørende for å opprettholde sikkerhet og overholdelse av retningslinjer i komplekse samtale scenarier.

3. Veileder Jailbreaks: I et spesifikt scenario der modellen fungerer som en matematikkveileder, blir GPT-4.5 instruert om ikke å avsløre svaret på et matematikkspørsmål. Selv om GPT-4.5 ikke overgår GPT-4O i denne spesielle evalueringen (GPT-4Os nøyaktighet er høyere), viser den fortsatt robusthet i å motstå forsøk på å lure den til å gi uautorisert informasjon.

4. Setnings- og passordbeskyttelse: GPT-4.5 viser sterk ytelse i å beskytte spesifikke setninger eller passord fra å bli avslørt gjennom brukerhjul. Dette indikerer en bedre evne til å opprettholde konfidensialitet og overholde sikkerhetsretningslinjer sammenlignet med noen tidligere modeller.

Totalt sett er GPT-4.5s forbedringer i håndtering av motstridende meldinger en del av dens bredere forbedringer i sikkerhet, nyanse og samarbeid, noe som gjør det mer effektivt for å opprettholde sikre og passende interaksjoner [1] [3].

Sitasjoner:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explained-everything-you-need-to-vet
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-they-compare
[5] https://www.businessinsider.com/openai-sam-oLtman-releases-gpt-4-5-emotionally-intelligent-modell-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-hould-know-about-the- og new-tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_smessages3_hours_now/