Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jaká konkrétní vylepšení má GPT-4.5 nad GPT-4O při manipulaci s konfliktními zprávami


Jaká konkrétní vylepšení má GPT-4.5 nad GPT-4O při manipulaci s konfliktními zprávami


GPT-4.5 ukazuje konkrétní vylepšení oproti GPT-4o při zpracování konfliktních zpráv prostřednictvím jeho vylepšené hierarchie instrukcí. Tato funkce umožňuje modelu upřednostňovat systémové zprávy před uživatelskými zprávami a zmírnit riziko rychlých injekcí a jiných útoků, které by mohly potlačit bezpečnostní pokyny. Zde jsou klíčová vylepšení:

1. Hodnocení hierarchie instrukcí: V hodnoceních, kde různé typy zpráv jsou v rozporu s sebou, je GPT-4.5 vyškolen, aby dodržoval pokyny ve zprávě s nejvyšší prioritou. To pomáhá modelu lépe zpracovávat scénáře, kde by se vstupy uživatelů mohly pokusit obejít bezpečnostní protokoly.

2. Řešení konfliktů: GPT-4,5 obecně překonává GPT-4o v hodnoceních zahrnujících konflikty mezi systémem a uživatelskými zprávami. Toto zlepšení je zásadní pro udržení bezpečnosti a dodržování pokynů ve složitých konverzačních scénářích.

3.. Tvrdící útěk z vězení: V konkrétním scénáři, ve kterém model působí jako matematický učitel, je GPT-4.5 instruován, aby neodhalil odpověď na matematickou otázku. Zatímco GPT-4.5 v tomto konkrétním hodnocení nepřekonává GPT-4o (přesnost GPT-4O je vyšší), stále prokazuje robustnost při odolávání pokusů o to, aby je přimělo k poskytnutí neautorizovaných informací.

4. Ochrana frází a hesel: GPT-4.5 ukazuje silný výkon při ochraně konkrétních frází nebo hesel před odhalením prostřednictvím uživatelských výzev. To ukazuje na lepší schopnost udržovat důvěrnost a dodržovat bezpečnostní pokyny ve srovnání s některými předchozími modely.

Celkově jsou vylepšení GPT-4.5 při manipulaci s konfliktními zprávami součástí jejích širších vylepšení v oblasti bezpečnosti, nuance a spolupráce, což zefektivňuje udržování bezpečných a vhodných interakcí [1] [3].

Citace:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/Whatis/feature/GPT-4OMEXPLIPTED-everything-You-Need-Tonow
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/GPT-4o-vs-gpt-4-how-do-they-compare
[5] https://www.businessinsider.com/openai-sam-altman-releseaseg-gpt-4-5-emotionally-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4-all-you-shold-ing-the-update-and-new-tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/