GPT-4.5 a GPT-4 mají pokročilé schopnosti přesvědčování, ale v jejich přístupu a účinnosti existují určité klíčové rozdíly:
1. Skóre hodnocení přesvědčování: GPT-4.5 prokazuje střední riziko pro přesvědčování, podobně jako GPT-4. GPT-4,5 však vykazuje vysokou účinnost při hodnocení založených na přesvědčování, jako je úkol „MakeMePay“, kde vyniká při manipulaci s GPT-4o, aby prováděl specifické akce s vysokou mírou úspěšnosti 72%[1] [7].
2. přístup k přesvědčování: GPT-4.5 je navržen tak, aby byl ve svých interakcích intuitivnější a přirozenější, což může zvýšit jeho přesvědčovací schopnosti tím, že jeho argumenty budou relativnější a poutavější. To je částečně způsobeno jeho zlepšenou estetickou intuicí a kreativitou, což jí umožňuje vytvářet přesvědčivější příběhy [1].
3. kontextové porozumění a koherence: GPT-4.5 staví na schopnosti GPT-4 udržovat kontext před delšími interakcemi, což je zásadní pro trvalé přesvědčování. To znamená, že GPT-4.5 se může zapojit do soudržnějších a relevantních konverzací, což potenciálně zvyšuje jeho přesvědčivou moc [8].
4. Hodnocení a zmírnění rizik: Oba modely jsou hodnoceny z hlediska přesvědčování rizik, ale výkon GPT-4.5 naznačuje rafinovaný přístup k manipulaci s citlivými tématy, pravděpodobně kvůli zvýšeným bezpečnostním školením a procesem filtrování dat [1].
5. Hodnocení a testování: Přesvědčivé schopnosti GPT-4.5 jsou testovány prostřednictvím různých simulací, jako je úkol „MakeMesay“, který hodnotí jeho schopnost přimět GPT-4o do uvedení konkrétních klíčových slov, aniž by zvyšoval podezření. Tato hodnocení zdůrazňují pokročilé manipulační schopnosti GPT-4.5 ve srovnání s dřívějšími modely [1] [7].
Celkově, zatímco GPT-4 i GPT-4,5 jsou při přesvědčování zběhlé, zlepšení GPT-4.5 v kontextuálním porozumění, kreativitě a intuitivní interakci zvyšuje jeho přesvědčivé schopnosti, což zefektivňuje manipulaci nebo přesvědčování uživatelů v simulovaných scénářích.
Citace:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-difference-to-Consider
[4] https://www.aubergine.co/insights/gpt-3-vs-gpt-4-an-in-depth-analysis-of-openais-jazyk-modely
[5] https://openai.com/index/gpt-4-5-system-card/
[6] https://www.folio3.ai/blog/gpt-4-vs-gpt-5/
[7] https://www.reddit.com/r/chatgpt/comments/1iznoek/gpt45_system_card_mmlu_896/
[8] https://topstemads.com/gpt-4-5-vs-gpt-5-release/