GPT-4.5 ukazuje zlepšený výkon při řešení protichůdných pokynů ve srovnání s dřívějšími verzemi, zejména prostřednictvím jeho zlepšené hierarchie instrukcí. Tato funkce umožňuje modelu upřednostňovat systémové zprávy před vstupy uživatelů a zmírnit rizika spojená s rychlými injekcemi a dalšími útoky, které by mohly potlačit bezpečnostní pokyny.
V hodnocení zahrnujících konfliktní typy zpráv, GPT-4.5 obecně překonává GPT-4o. Model je vyškolen tak, aby dodržoval pokyny ve zprávě s nejvyšší prioritou, což pomáhá ve scénářích, kde je konflikt systémových a uživatelských zpráv. Například ve scénáři, ve kterém je model pokyn, aby neodpověděl na matematickou otázku, GPT-4.5 ukazuje lepší dodržování těchto systémových pokynů ve srovnání s GPT-4o, ačkoli nepřekoná GPT-4O1 ve všech hodnoceních [1].
Kromě toho byl GPT-4.5 vyhodnocen ve scénářích, kde musí chránit konkrétní fráze nebo hesla před odhalením prostřednictvím uživatelských výzev. V těchto hodnoceních funguje GPT-4.5 dobře, což ukazuje na jeho schopnost udržovat zabezpečení a dodržovat systémové pokyny, i když čelí konfliktním uživatelským vstupům [1].
Přestože se GPT-4.5 zlepšuje na dřívějších modelech při řešení protichůdných pokynů, stále čelí výzvám v určitých složitých scénářích. Výkon modelu v hodnocení červených týmů, které simulují výzvu k kontradiktoru, ukazuje, že v některých případech může produkovat nebezpečné výstupy, i když v těchto náročných testech obecně funguje lépe než GPT-4o [1].
Celkově je vylepšení GPT-4.5 při řešení protichůdných pokynů pro konfliktní pokyny spolehlivější volbou pro aplikace vyžadující přísné dodržování bezpečnostních pokynů a systémových pokynů.
Citace:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-Model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-difference-to-Consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_significaly_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/ChatGPT-45-MODEL-OPENAI-ZDRAVOSTI