GPT-4.5: Javított teljesítmény az ütköző utasítások kezelésében

Hogyan hasonlítja össze a GPT-4.5 teljesítményét az ütköző utasítások kezelésében a korábbi verziókkal

A GPT-4.5 javítja a teljesítményt az ütköző utasítások kezelésében a korábbi verziókhoz képest, különösen a továbbfejlesztett oktatási hierarchiáján keresztül. Ez a szolgáltatás lehetővé teszi a modell számára, hogy a rendszerüzeneteket a felhasználói bemenetekkel szemben rangsorolja, az azonnali injekciókkal és egyéb támadásokkal kapcsolatos kockázatokkal, amelyek felülbírálhatják a biztonsági utasításokat.

Az ütköző üzenettípusokkal kapcsolatos értékelések során a GPT-4.5 általában felülmúlja a GPT-4O-t. A modellt arra képzik, hogy kövesse az utasításokat a legmagasabb prioritású üzenetben, amely segít a forgatókönyvekben, ahol a rendszer és a felhasználói üzenetek konfliktusok. Például egy olyan forgatókönyvben, amikor a modellt arra utasítják, hogy ne adja el a választ egy matematikai kérdésre, a GPT-4.5 jobban betartja ezeket a rendszer utasításait, mint a GPT-4O, bár az összes értékelés során nem haladja meg a GPT-4O1-et [1].

Ezenkívül a GPT-4.5-et olyan forgatókönyvekben értékelték, ahol meg kell védenie a konkrét kifejezéseket vagy jelszavakat a felhasználói utasítások révén. Ezekben az értékelésekben a GPT-4.5 jól teljesít, jelezve annak képességét, hogy fenntartsa a biztonságot és kövesse a rendszer utasításait, még akkor is, ha ellentmondásos felhasználói bemenetekkel szembesülnek [1].

Noha a GPT-4.5 javul az ütköző utasítások kezelésében a korábbi modelleknél, bizonyos összetett forgatókönyvekben még mindig kihívásokkal kell szembenéznie. A modell teljesítménye a vörös csoportosítási értékelések során, amelyek a versengés felszólítását szimulálják, azt mutatja, hogy bizonyos esetekben nem biztonságos kimeneteket képes előállítani, bár ezekben a kihívásokkal teli tesztekben általában jobban teljesít, mint a GPT-4O [1].

Összességében a GPT-4.5 fejlesztései az ütköző utasítások kezelésében megbízhatóbb választássá teszik a biztonsági irányelvek és a rendszer utasításainak szigorú betartását igénylő alkalmazások számára.

Idézetek:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-here-how-good-this-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-t-t--consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/GPT_4_HAS_BEEN_TONED_DOWN_SIGNIFIFIFICENCH_AND/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-reelease
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-reasoning