GPT-4.5: patobulintas veikimas tvarkant prieštaringas instrukcijas

Kaip „GPT-4.5“ našumas palyginamas su ankstesnėmis versijomis tvarkant prieštaringas instrukcijas

„GPT-4.5“ parodo geresnes veiklos rezultatus tvarkant prieštaringas instrukcijas, palyginti su ankstesnėmis versijomis, ypač dėl patobulintos instrukcijų hierarchijos. Ši funkcija leidžia modeliui nustatyti prioritetus sistemos pranešimams, o ne vartotojo įvestims, sušvelninti riziką, susijusią su greitomis injekcijomis ir kitomis atakomis, kurios gali nepaisyti saugos instrukcijų.

Vertinant prieštaringus pranešimų tipus, GPT-4.5 paprastai pralenkia GPT-4o. Modelis yra išmokytas vadovautis instrukcijomis pagal aukščiausio prioriteto pranešimą, kuris padeda scenarijuose, kuriuose prieštarauja sistemos ir vartotojo pranešimai. Pavyzdžiui, scenarijuje, kai modeliui nurodoma neatsisakyti atsakymo į matematikos klausimą, GPT-4.5 rodo geresnį šių sistemos instrukcijų laikymąsi, palyginti su GPT-4o, nors visuose vertinimuose jis nepralenkia GPT-4O1 [1].

Be to, GPT-4.5 buvo įvertintas scenarijuose, kur jis turi apsaugoti konkrečias frazes ar slaptažodžius nuo atskleidimo per vartotojo raginimus. Atliekant šiuos vertinimus, GPT-4.5 veikia gerai, nurodant jo sugebėjimą išlaikyti saugumą ir laikytis sistemos instrukcijų net ir susidūręs su prieštaringais vartotojo įvestimis [1].

Vis dėlto, nors GPT-4.5 pagerėja ankstesniuose modeliuose tvarkant prieštaringas instrukcijas, tačiau tam tikrais sudėtingais scenarijais ji vis dar susiduria su iššūkiais. Modelio rezultatai „Red Teaming“ vertinimuose, kurie imituoja prieštaringą raginimą, rodo, kad kai kuriais atvejais jis gali sukelti nesaugius rezultatus, nors šiais sudėtingais testais paprastai jis veikia geriau nei GPT-4o [1].

Apskritai, „GPT-4.5“ patobulinimai tvarkant prieštaringas instrukcijas daro jį patikimesniu pasirinkimu programoms, reikalaujančioms griežtai laikytis saugos gairių ir sistemos instrukcijų.

Citatos:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-os-model-is
[4] https://www.techtarget.com/searchenterpriseai/TIP/GPT-35-VS-GPT-4 Didžiausi-diferences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18Monbs/gpt_4_has_been_toned_down_downfithy_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-easoning