GPT-4.5: Uzlabota veiktspēja, rīkojoties ar konfliktējošām instrukcijām

Kā GPT-4.5 veiktspēja ir salīdzināma ar iepriekšējām versijām, apstrādājot pretrunīgas instrukcijas

GPT-4.5 parāda uzlabotu veiktspēju, apstrādājot konfliktējošās instrukcijas, salīdzinot ar iepriekšējām versijām, jo īpaši ar tās uzlaboto instrukciju hierarhijas palīdzību. Šī funkcija ļauj modelim prioritizēt sistēmas ziņojumus, salīdzinot ar lietotāja ievadiem, mazinot riskus, kas saistīti ar tūlītējām injekcijām un citiem uzbrukumiem, kas varētu ignorēt drošības norādījumus.

Novērtējumos, kas saistīti ar pretrunīgiem ziņojumu veidiem, GPT-4.5 parasti pārspēj GPT-4O. Modelis ir apmācīts ievērot instrukcijas augstākās prioritātes ziņojumā, kas palīdz scenārijos, kad sistēmas un lietotāja ziņojumi ir konflikti. Piemēram, scenārijā, kurā modelim tiek uzdots nesniegt atbildi uz matemātikas jautājumu, GPT-4.5 parāda labāku šo sistēmas instrukciju ievērošanu salīdzinājumā ar GPT-4O, lai gan tas nepārspēj GPT-4O1 visos novērtējumos [1].

Turklāt GPT-4.5 ir novērtēts scenārijos, kur tam ir jāaizsargā īpašas frāzes vai paroles no tā, ka tās tiek atklātas, izmantojot lietotāju uzvednes. Šajos novērtējumos GPT-4.5 darbojas labi, norādot uz tās spēju saglabāt drošību un ievērot sistēmas instrukcijas pat saskaroties ar pretrunīgām lietotāju ieejām [1].

Tomēr, lai gan GPT-4.5 uzlabo iepriekšējos modeļus, apstrādājot konfliktējošās instrukcijas, tas joprojām saskaras ar izaicinājumiem noteiktos sarežģītos scenārijos. Modeļa sniegums sarkanās komandas vērtēšanas novērtējumos, kas simulē pretrunīgu pamudinājumu, parāda, ka dažos gadījumos tas var radīt nedrošu rezultātu, lai gan šajos izaicinošajos testos tas parasti darbojas labāk nekā GPT-4O [1].

Kopumā GPT-4.5 uzlabojumi konfliktējošo instrukciju apstrādē padara to par ticamāku izvēli lietojumprogrammām, kurām nepieciešama stingra drošības vadlīniju un sistēmas instrukciju ievērošana.

Atsauces:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-dood-this-model-is
.
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_signrificanty_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-reasoning