GPT-4.5 Oktatási hierarchia: A rendszerüzenetek prioritása a biztonság és a biztonság érdekében

Hogyan rangsorolja a GPT-4.5 a rendszerüzeneteket a felhasználói üzenetekhez képest?

A GPT-4.5 a rendszerüzeneteket a felhasználói üzenetek felett prioritást élvez egy utasítási hierarchián keresztül, amelynek célja az azonnali injekciók és más támadások kockázatának enyhítése, amelyek felülbírálhatják a modell biztonsági utasításait. Ez a hierarchia az üzeneteket két fő típusba sorolja: rendszerüzenetek és felhasználói üzenetek. A rendszerüzenetek alapvetően rejtett utasítások, amelyek irányítják az AI viselkedését, míg a felhasználói üzenetek a felhasználók által biztosított bemenetek.

A GPT-4.5-ben, amikor a rendszer és a felhasználói üzenetek konfliktusok, a modellt arra képzik, hogy kövesse a rendszerüzenetben szereplő utasításokat a felhasználói üzenetben. Ezt úgy érik el, hogy a modell felügyelete olyan példákon, ahol az ilyen típusú üzenetek konfliktusban vannak. A modell megtanulja a rendszerüzenetek rangsorolását a biztonsági irányelvek betartása és a nem kívánt kimenetek megelőzése érdekében.

Például, ha egy felhasználó megpróbálja becsapni a modellt káros információk szolgáltatására, akkor a rendszerüzenet utasíthatja a modellt, hogy utasítsa el az ilyen kérelmeket. A GPT-4.5 képessége, hogy betartsa ezt a hierarchiát, elősegíti a biztonsági előírások fenntartását és megakadályozását, hogy a modell manipulálódjon a megtiltott tartalom generálásához.

Ez a megközelítés elengedhetetlen annak biztosítása érdekében, hogy a GPT-4.5 következetesen viselkedjen a tervezett biztonsági és etikai iránymutatásokkal, még akkor is, ha szembesülnek azzal, hogy megkíséreljük ezeket a szabályokat megkerülni az ügyesen kialakított felhasználói bemenetek révén. A rendszerüzenetek prioritása révén az OpenAi célja a modell megbízhatóságának és biztonságának javítása különféle alkalmazásokban [1] [2].

Idézetek:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.prompthub.us/blog/everything-system-messages-how-touse-them-real-world-experiments-prompt-injektáló-protektorok
[3] https://platform.openai.com/docs/guides/proppt-engineering
[4] https://community.openai.com/t/whys-gpt-4o-inanely-limited-t-e-fus-and-even-plus-users-it- literally-gives-you-5-messages-in-5-6-hours-the-fre-users/769852
[5] https://9meters.com/technology/ai/gpt-4-5-begins-rolling-out-to-plus-and-team-users-next-week-to-enterprise-and-edu-users-the-following-week
[6] https://arxiv.org/html/2408.10943v1
[7] https://www.pymnts.com/artificial-intelligence-2/2025/openai-to-rease-gpt-4-5-within-weks-gpt-5-within-months/
[8] https://www.reddit.com/r/chatgptpro/comments/13n55w7/highly_effeny_proppt_for_summarizing_gpt4/