GPT-4.5 prikazuje posebne izboljšave v primerjavi z GPT-4O pri ravnanju s konfliktnimi sporočili s svojo izboljšano hierarhijo pouka. Ta funkcija omogoča modelu, da prednostno določi sistemska sporočila nad uporabniškimi sporočili, kar ublaži tveganje hitrih injekcij in drugih napadov, ki bi lahko preglasili varnostna navodila. Tu so ključne izboljšave:
1. Ocenjevanje hierarhije navodil: V ocenah, ko različne vrste sporočil med seboj nasprotujejo, je GPT-4.5 usposobljen, da sledi navodilom v najvišji prednostni sporočili. To pomaga modelu, da bolje obvlada scenarije, kjer lahko uporabniški vhodi poskušajo zaobiti varnostne protokole.
2. Reševanje konfliktov: GPT-4.5 Na splošno presega GPT-4O pri ocenah, ki vključujejo konflikte med sistemskimi in uporabniškimi sporočili. To izboljšanje je ključnega pomena za ohranjanje varnosti in spoštovanja smernic v zapletenih pogovornih scenarijih.
3. Tutor Jailbreaks: V določenem scenariju, kjer model deluje kot matematični učitelj, GPT-4.5 naroči, da ne razkrije odgovora na matematično vprašanje. Medtem ko GPT-4.5 pri tej oceni ne presega GPT-4O (natančnost GPT-4O je večja), še vedno kaže na robustnost pri upiranju poskusom, da bi jo prevarali pri zagotavljanju nepooblaščenih informacij.
4. Zaščita besedne zveze in gesla: GPT-4.5 prikazuje močno uspešnost pri zaščiti določenih stavkov ali gesel, da se ne razkrijejo prek uporabniških pozivov. To kaže na boljšo sposobnost vzdrževanja zaupnosti in spoštovanja varnostnih smernic v primerjavi z nekaterimi prejšnjimi modeli.
Na splošno so izboljšave GPT-4.5 pri obravnavanju nasprotujočih si sporočil del njenih širših izboljšav v varnosti, niansi in sodelovanju, zaradi česar je učinkovitejša pri ohranjanju varnih in ustreznih interakcij [1] [3].
Navedbe:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explained-everything-you-need-to-vedo
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterPriseai/feature/gpt-4o-vs-gpt-4-how-do-they-Compare
[5] https://www.businessinsinder.com/openai-sam-altman-releases-gpt-4-5-emotional-Inteligent-Model-2025-2
[6] https://litsslink.com/blog/gpt-4o-all-you-should-know-About-the-upDate-in -n-tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/