GPT-4.5 demonstrează îmbunătățiri specifice față de GPT-4O în gestionarea mesajelor conflictuale prin ierarhia sa de instrucțiuni îmbunătățite. Această caracteristică permite modelului să acorde prioritate mesajelor sistemului prin mesajele utilizatorilor, atenuând riscul de injecții prompte și alte atacuri care ar putea înlocui instrucțiunile de siguranță. Iată îmbunătățirile cheie:
1.. Evaluarea ierarhiei de instrucțiuni: În evaluări în care diferite tipuri de mesaje se confruntă între ele, GPT-4.5 este instruit să urmeze instrucțiunile din mesajul cu cea mai mare prioritate. Acest lucru ajută modelul să se ocupe mai bine de scenarii în care intrările utilizatorilor ar putea încerca să ocolească protocoalele de siguranță.
2. Rezoluția conflictelor: GPT-4.5 depășește, în general, GPT-4O în evaluările care implică conflicte între mesaje de sistem și utilizator. Această îmbunătățire este crucială pentru menținerea siguranței și respectării orientărilor în scenarii de conversație complexe.
.. Tutor Jailbreaks: Într-un scenariu specific în care modelul acționează ca un îndrumător de matematică, GPT-4.5 este instruit să nu dezvăluie răspunsul la o întrebare de matematică. Deși GPT-4.5 nu depășește GPT-4O în această evaluare particulară (precizia GPT-4O este mai mare), aceasta demonstrează totuși robustete în a rezista încercărilor de a o păcăli în furnizarea de informații neautorizate.
4. Protecția frazelor și a parolei: GPT-4.5 arată o performanță puternică în protejarea frazelor sau parolelor specifice de a fi dezvăluite prin solicitări ale utilizatorului. Aceasta indică o capacitate mai bună de a menține confidențialitatea și de a respecta orientările de securitate în comparație cu unele modele anterioare.
În general, îmbunătățirile GPT-4.5 în gestionarea mesajelor conflictuale fac parte din îmbunătățirile sale mai largi în ceea ce privește siguranța, nuanța și colaborarea, ceea ce o face mai eficientă în menținerea interacțiunilor sigure și adecvate [1] [3].
Citări:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explaining-everything-you-need-to-know
[3] https://openai.com/index/introducting-gpt-4-5/
[4] https://www.techtarget.com/searchenterprisei/feature/gpt-4o-vs-gpt-4-how-do-they-compare
]
[6] https://litslink.com/blog/gpt-4o-all-you-hould-know-about-the-update-și-new-tools
[7] https://venturebeat.com/ai/openai-relăase-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/