GPT-4.5 ir GPT-4o: Pagrindiniai patobulinimai tvarkant prieštaringus pranešimus

Kokius konkrečius patobulinimus daro GPT-4.5, viršijant GPT-4o tvarkant prieštaringus pranešimus

GPT-4.5 parodo konkrečius patobulinimus, palyginti su GPT-4o, tvarkant prieštaringus pranešimus per patobulintą instrukcijų hierarchiją. Ši funkcija leidžia modeliui nustatyti prioritetus sistemos pranešimams, o ne vartotojo pranešimams, sušvelninti greitų injekcijų ir kitų atakų, kurios gali nepaisyti saugos instrukcijų, riziką. Čia yra pagrindiniai patobulinimai:

1. Instrukcijų hierarchijos vertinimas: vertinant, kai skirtingų tipų pranešimai prieštarauja vienas su kitu, GPT-4.5 mokomas vadovautis instrukcijomis aukščiausiu prioritetiniu pranešimu. Tai padeda modeliui geriau tvarkyti scenarijus, kuriuose vartotojo įvestys gali bandyti apeiti saugos protokolus.

2. Konflikto sprendimas: GPT-4.5 paprastai pralenkia GPT-4o vertinimus, susijusius su konfliktais tarp sistemos ir vartotojo pranešimų. Šis patobulinimas yra labai svarbus norint išlaikyti saugumą ir laikymąsi gairių sudėtinguose pokalbio scenarijuose.

3. Dėstytojo „Jailbreaks“: konkrečiame scenarijuje, kai modelis veikia kaip matematikos dėstytojas, GPT-4.5 nurodoma neatskleisti atsakymo į matematikos klausimą. Nors GPT-4.5 šiame konkrečiame vertinime nepralenkia GPT-4o (GPT-4O tikslumas yra didesnis), jis vis tiek rodo tvirtumą priešintis bandymams apgauti ją teikiant neteisėtą informaciją.

4. Frazė ir slaptažodžio apsauga: GPT-4.5 rodo stiprią našumą apsaugant konkrečias frazes ar slaptažodžius nuo atskleidimo per vartotojo raginimus. Tai rodo geresnį sugebėjimą išlaikyti konfidencialumą ir laikytis saugumo gairių, palyginti su kai kuriais ankstesniais modeliais.

Apskritai, „GPT-4.5“ patobulinimai tvarkant prieštaringus pranešimus yra dalis platesnių saugos, niuansų ir bendradarbiavimo patobulinimų, todėl jis yra veiksmingesnis palaikant saugią ir tinkamą sąveiką [1] [3].

Citatos:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatnis/feature/GPT-4o-Explained-EveryThing-you-Beed-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-they-compare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5-emotically- intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-hould-know-outhe-update-and-new-tools
[7] https://ventureebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/