GPT-4.5: Izboljšana uspešnost pri ravnanju z nasprotujočimi si navodili

Kako se uspešnost GPT-4.5 primerja s prejšnjimi različicami pri ravnanju

GPT-4.5 prikazuje izboljšano delovanje pri ravnanju s nasprotujočimi si navodili v primerjavi s prejšnjimi različicami, zlasti s svojo izboljšano hierarhijo pouka. Ta funkcija omogoča modelu, da prednostno določi sistemska sporočila nad uporabniškimi vhodi, ublaži tveganja, povezana s hitrimi injekcijami in drugimi napadi, ki bi lahko nadzirali varnostna navodila.

Pri ocenah, ki vključujejo nasprotujoče si vrste sporočil, GPT-4.5 na splošno presega GPT-4O. Model je usposobljen, da sledi navodilom v najvišji prednostni sporočili, ki pomaga v scenarijih, v katerih sistemska in uporabniška sporočila konflikta. Na primer, v scenariju, kjer je model poučen, da odgovora ne daje matematičnega vprašanja, GPT-4.5 kaže boljše spoštovanje teh sistemskih navodil v primerjavi z GPT-4O, čeprav pri vseh ocenah ne presega GPT-4O1 [1].

Poleg tega je bil GPT-4.5 ocenjen v scenarijih, kjer mora zaščititi določene stavke ali gesla pred razkritjem prek uporabniških pozivov. V teh ocenah GPT-4.5 dobro deluje, kar kaže na njegovo sposobnost vzdrževanja varnosti in upoštevanja sistemskih navodil, tudi ko se soočajo z nasprotujočimi si vhodi uporabnikov [1].

Kljub temu, da se GPT-4.5 izboljšuje pri prejšnjih modelih pri ravnanju z nasprotujočimi si navodili, se še vedno spopada z izzivi v določenih zapletenih scenarijih. Učinkovitost modela pri ocenjevanju rdečega združevanja, ki simulirajo nasprotno spodbudo, kaže, da lahko v nekaterih primerih ustvari nevarne rezultate, čeprav na teh zahtevnih testih na splošno deluje bolje kot GPT-4O [1].

Na splošno so izboljšave GPT-4.5 pri ravnanju z navodili za nasprotujoče si, da je zanesljivejša izbira za aplikacije, ki zahtevajo strogo spoštovanje varnostnih smernic in sistemskih navodil.

Navedbe:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-Crared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model -is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1IZN175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_significially_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-rease
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-penai-reasoning