GPT-4.5 demonštruje špecifické vylepšenia oproti GPT-4O pri riešení konfliktných správ prostredníctvom svojej vylepšenej hierarchie výučby. Táto funkcia umožňuje modelu uprednostňovať systémové správy pred používateľskými správami, čím sa zmierňuje riziko rýchlych injekcií a iných útokov, ktoré by mohli potlačiť bezpečnostné pokyny. Tu sú kľúčové vylepšenia:
1. Vyhodnotenie hierarchie výučby: V hodnotení, kde sú navzájom rôzne typy správ, je GPT-4,5 vyškolený na dodržiavanie pokynov v správe s najvyššou prioritou. To pomáha modelu lepšie zvládnuť scenáre, v ktorých sa vstupy používateľov môžu pokúsiť obísť bezpečnostné protokoly.
2. Riešenie konfliktov: GPT-4,5 vo všeobecnosti prekonáva GPT-4O v hodnotení týkajúcich sa konfliktov medzi systémami a používateľskými správami. Toto zlepšenie je rozhodujúce pre udržanie bezpečnosti a dodržiavania pokynov v zložitých konverzačných scenároch.
3. Tougrbreaks: V konkrétnom scenári, v ktorom model pôsobí ako matematický lektor, je GPT-4,5 pokyn, aby neodhalil odpoveď na matematickú otázku. Zatiaľ čo GPT-4,5 v tomto konkrétnom hodnotení neprekonáva GPT-4O (presnosť GPT-4O je vyššia), stále ukazuje robustnosť pri odrádzaní od pokusov o to, aby ju poskytla neoprávnené informácie.
4. Ochrana frázy a hesla: GPT-4.5 ukazuje silný výkon pri ochrane konkrétnych fráz alebo hesiel pred odhalením prostredníctvom používateľských výziev. To naznačuje lepšiu schopnosť udržiavať dôvernosť a dodržiavať bezpečnostné pokyny v porovnaní s niektorými predchádzajúcimi modelmi.
Celkovo sú zlepšenia GPT-4,5 v riešení protichodných správ súčasťou jej širších vylepšení v oblasti bezpečnosti, nuancie a spolupráce, čím je efektívnejšie pri udržiavaní bezpečných a vhodných interakcií [1] [3].
Citácie:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explained-everything-you-eed-to-note
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/Searchenterpriseai/feature/gpt-4o-vs-gpt-4-4-how-do--they-compare
[5] https://www.businessinsider.com/openai--d
[6] https://litslink.com/blog/gpt-4o-all-you-hould-know-kot-about-pdate-and-new-tools
[7] https://venturebeat.com/ai/openai-releases--gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/