Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuidas võrrelda GPT-4.5 jõudlust varasemate versioonidega vastuoluliste juhiste käsitlemisel


Kuidas võrrelda GPT-4.5 jõudlust varasemate versioonidega vastuoluliste juhiste käsitlemisel


GPT-4.5 demonstreerib varasemate versioonidega võrreldes vastuoluliste juhiste paremat jõudlust, eriti selle täiustatud juhendamishierarhia kaudu. See funktsioon võimaldab mudelil eelistada süsteemisõnumeid kasutaja sisenditega, leevendades kiirete süstidega seotud riske ja muude rünnakutega, mis võivad ohutusjuhised alistada.

Hindamistes, mis hõlmavad vastuolulisi sõnumitüüpe, edestab GPT-4,5 üldiselt GPT-4O. Mudelit koolitatakse järgima juhiseid kõrgeima prioriteediga sõnumis, mis aitab stsenaariumidel, kus süsteemi- ja kasutajateated on vastuolus. Näiteks stsenaariumi korral, kus mudelile antakse vastust matemaatikaküsimusele, näitab GPT-4.5 nende süsteemijuhiste paremat järgimist võrreldes GPT-4O-ga, ehkki see ei ületa GPT-4O1 kõigis hinnangutes [1].

Lisaks on GPT-4.5 hinnatud stsenaariumides, kus see peab kaitsma konkreetseid fraase või paroole kasutajajuhtide kaudu ilmumise eest. Nendes hinnangutes toimib GPT-4.5 hästi, osutades selle võimele säilitada turvalisust ja jälgida süsteemi juhiseid isegi siis, kui nad seisavad silmitsi vastuoluliste kasutaja sisenditega [1].

Ehkki GPT-4.5 parandab varasemaid mudeleid vastuoluliste juhiste käsitlemisel, seisab see teatud keerukate stsenaariumide korral silmitsi väljakutsetega. Mudeli jõudlus punaste meeskondade hindamisel, mis simuleerivad võistlevaid viiteid, näitab, et see võib mõnel juhul tekitada ohtlikke väljundeid, ehkki nende keeruliste testide puhul toimib see üldiselt paremini kui GPT-4O [1].

Üldiselt muudavad GPT-4.5 täiustused konfliktiliste juhiste käsitlemisel usaldusväärsema valiku rakenduste jaoks, mis nõuavad ohutusjuhiste ja süsteemijuhiste ranget järgimist.

Tsitaadid:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
]
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-th-model-is
]
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
]
]
]