Učinkovitost GPT-4.5 o tihem znanju in odpravljanju težav v primerjavi z GPT-4 odraža napredek pri ravnanju s kompleksnimi in niansiranimi poizvedbami. Medtem ko v razpoložljivih informacijah niso podrobno opisane posebne meritve za tiho znanje in odpravljanje težav, je mogoče poudariti več ključnih izboljšav GPT-4.5:
1. Hierarhija in varnost pouka: GPT-4.5 je bil usposobljen, da se drži hierarhije navodil, kar pomaga ublažiti tveganje za hitre injekcije in druge napade. To pomeni, da je bolje pri spremljanju sistemskih navodil glede nasprotujočih si uporabniških sporočil in izboljšanje njegove sposobnosti za obvladovanje zapletenih scenarijev, ki bi lahko zahtevali odpravljanje težav [1]. V nasprotju s tem GPT-4 nima te posebne izboljšave, omenjene v literaturi.
2. Dvoumna vprašanja: GPT-4.5 kaže nekoliko nižjo natančnost dvoumnih vprašanj v primerjavi z GPT-4O (različica GPT-4), z natančnostjo 0,95 za GPT-4O v primerjavi z 0,95 za GPT-4 in 0,95 za GPT-4,5. Vendar je uspešnost GPT-4.5 o nedvoumnih vprašanjih podobna GPT-4O, kar kaže na to, da oba modela učinkovito obravnavata jasne poizvedbe [1].
3. Tiho znanje in odpravljanje težav: Medtem ko posebne meritve za tiho znanje in odpravljanje težav niso zagotovljene, izboljšana sposobnost GPT-4.5 za obvladovanje nasprotujočih si sporočil in njegova izboljšana hierarhija pouka kažejo, da bi lahko bolje delovali v scenarijih, ki zahtevajo niansirano razumevanje in odpravljanje težav. GPT-4 je po drugi strani znan po izboljšanju jezikovnega razumevanja in sposobnosti zagotavljanja natančnejših odgovorov na zapletene poizvedbe [2].
4. Multimodalne zmogljivosti: GPT-4, ki je osnova za GPT-4.5, ponuja znatne izboljšave v primerjavi z GPT-3.5 v multimodalnih zmožnostih in ravnanju s kompleksnimi poizvedbami. GPT-4 lahko obdela in se odzove na širši nabor podatkovnih vhodov, zaradi česar je bolj vsestranski za naloge, ki bi lahko vključevale odpravljanje težav ali tihega znanja [2] [6].
Če povzamemo, medtem ko GPT-4.5 temelji na prednosti GPT-4, zlasti pri ravnanju s kompleksnimi navodili in varnostnimi protokoli, njegova posebna uspešnost o tihem znanju in odpravljanju težav ni podrobno opisana. Vendar pa njegova izboljšana hierarhija pouka in izboljšano ravnanje s konfliktnimi sporočili kažeta, da bi lahko bil učinkovitejši v niansiranih scenarijih za odpravljanje težav.
Navedbe:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581Ba4b5d0f0a6c508d1/gpt-4-5_syscar_card
[2] https://datascicondojo.com/blog/gpt-3-5-vs-gpt-4-debate/
[3] https://www.opastpublishers.com/open-access-articles/evaluting-errors-and-improving-performance-of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow-p-to-instructions-and-tasks/613298
[6] https://www.aubergine.co/insights/gpt-3-5-vs-gpt-4-an-in-depth-analysis-OF-Openais-Language-model
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider