A GPT-4.5 célja az, hogy az ellentmondásos utasításokat a többlépcsős problémákban kezelje az oktatási hierarchiának. Ez a hierarchia segíti a modellt a rendszerüzenetek prioritássá tételében a felhasználói üzenetekhez képest, enyhítve az azonnali injekciók és más támadások kockázatát, amelyek felülbírálhatják a biztonsági utasításokat [1] [5].
Az ütköző utasítások kezelése
1. Oktatási hierarchia értékelése: A GPT-4.5 képzettséggel rendelkezik a legfontosabb prioritású üzenet felismerésére és követésére, amikor az ütköző üzenetekkel szembesül. Ez magában foglalja a forgatókönyveket, amikor a rendszer- és felhasználói üzenetek konfliktusok, és a modellnek meg kell választania, hogy melyik utasításkészletet kell követni [1].
2. Rendszer és felhasználói üzenetek: A modellt megtanítják a rendszerüzenetek prioritása, amelyek célja a biztonsági és működési iránymutatások érvényesítése, a felhasználói üzenetekhez képest. Ez biztosítja, hogy a GPT-4,5 ragaszkodjon a biztonsági protokollokhoz, még akkor is, ha a felhasználók megpróbálják megkerülni őket [1] [5].
3. Reális forgatókönyvek: Az értékelések olyan reális forgatókönyveket tartalmaznak, amelyekben a modell oktatóként működik, és ellenállnia kell a felhasználók azon kísérleteinek, hogy becsapják azt a válaszok vagy megoldások feltárására. A GPT-4.5-et arra utasítják, hogy ne adjon el választ, és ennek a rendszer utasításait kell követnie, annak ellenére, hogy a felhasználói megpróbálják megkerülni őket [1].
4. Kifejezés és jelszóvédelem: Egy másik típusú értékelésben a GPT-4.5 utasítást kap arra, hogy ne adjon ki konkrét kifejezéseket vagy ne tegyen fel jelszavakat. A modellnek ellenállnia kell a felhasználói üzeneteknek, amelyek célja annak becsapása, amely megmutatja az érzékeny információk védelmének képességét [1].
többlépéses probléma kezelése
Míg a GPT-4.5 célja az ütköző utasítások hatékony kezelése, a többlépcsős problémák kezelésének képessége javítható a felszólítások egyértelmű, egymást követő módon történő felépítésével. Ez magában foglalja a feladatok kisebb lépésekre való bontását és annak biztosítását, hogy minden lépés befejeződjön, mielőtt a következőre lépne [2]. A GPT-4.5 teljesítménye azonban a többlépcsős utasítások automatikus követésében kézi beavatkozás nélkül (például a "Next" felszólítás) továbbra is kihívás [4].
A teljesítmény javítása
A GPT-4.5 többlépcsős feladatokban végzett teljesítményének javítása érdekében a felhasználók olyan stratégiákat alkalmazhatnak, mint például:
- Tisztítsa meg a prompt -struktúrát: Használjon fejléceket vagy metszetjelölőket az egyes lépések egyértelmű meghatározásához, segítve a modellt a szekvencia hatékonyabb felismerésében és követésében [2].
-Szekvenciális végrehajtás: Végezzen el egy lépésről lépésre történő megközelítést, ahol minden lépést teljes mértékben feldolgoznak, mielőtt a következőre költöznének, amelyet a funkciókhoz hasonló struktúrák felhasználásával lehet megkönnyíteni [2].
- Kézi beavatkozás: Szükség esetén manuálisan kérje meg a modellt, hogy folytassa a következő lépést, mivel az nem mozog automatikusan egy sorrendben ilyen útmutatások nélkül [4].
Idézetek:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve-tasks
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api- output-gotth-d-strukture/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/