GPT-4.5: Zlepšený výkon pri riešení protichodných pokynov

Ako sa výkon GPT-4.5 porovnáva s predchádzajúcimi verziami pri riešení protichodných pokynov

GPT-4.5 demonštruje zlepšený výkon pri riešení protichodných pokynov v porovnaní s predchádzajúcimi verziami, najmä prostredníctvom svojej vylepšenej hierarchie výučby. Táto funkcia umožňuje modelu uprednostňovať systémové správy pred vstupmi používateľov, zmierňujúcich rizík spojených s rýchlymi injekciami a inými útokmi, ktoré by mohli potlačiť bezpečnostné pokyny.

V hodnotení zahŕňajúcich protichodné typy správ GPT-4.5 vo všeobecnosti prekonáva GPT-4o. Model je vyškolený na dodržiavanie pokynov v správe s najvyššou prioritou, ktorá pomáha v scenároch, v ktorých konflikty systémov a používateľov. Napríklad v scenári, keď je model inštruovaný, aby neodovzdal odpoveď na matematickú otázku, GPT-4,5 vykazuje lepšie dodržiavanie týchto systémových pokynov v porovnaní s GPT-4O, hoci vo všetkých hodnoteniach neprekonáva GPT-4O1 [1].

Okrem toho bol GPT-4,5 vyhodnotený v scenároch, kde musí chrániť konkrétne frázy alebo heslá pred odhalením prostredníctvom používateľských výziev. V týchto hodnoteniach funguje GPT-4,5 dobre, čo naznačuje jeho schopnosť udržiavať bezpečnosť a dodržiavať pokyny na systém, aj keď čelia protichodným vstupom používateľa [1].

Zatiaľ čo však GPT-4,5 zlepšuje predchádzajúce modely pri riešení protichodných pokynov, stále čelí výzvam v určitých zložitých scenároch. Výkonnosť modelu pri hodnotení červeného tímu, ktoré simulujú kontradiktórne vyvolávanie, ukazuje, že v niektorých prípadoch môže produkovať nebezpečné výstupy, hoci v týchto náročných testoch vo všeobecnosti má lepšiu výkonnosť ako GPT-4O [1].

Celkovo vylepšenia GPT-4,5 pri riešení protichodných pokynov z neho robia spoľahlivejšiu voľbu pre aplikácie vyžadujúce prísne dodržiavanie bezpečnostných pokynov a systémových pokynov.

Citácie:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-hishis-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/gpt_4_has_been_toned_down_significantly_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-orion-ai-model-rease
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-čítania