GPT-4.5 en GPT-4O zijn beide geavanceerde taalmodellen ontwikkeld door OpenAI, elk met verschillende verbeteringen ten opzichte van hun voorgangers. Bij het vergelijken van hun prestaties in termen van hallucinaties vertoont GPT-4.5 een significante verlaging van de hallucinatiepercentages in vergelijking met GPT-4O.
Hallucinatiereductie in GPT-4.5
-Hallucinatiepercentage: GPT-4.5 heeft een hallucinatiepercentage van ongeveer 19% wanneer getest op de Personqa-gegevensset, wat een aanzienlijke verbetering is ten opzichte van GPT-4O's percentage van ongeveer 52% [2] [5]. Deze reductie geeft aan dat GPT-4.5 betrouwbaarder is en minder vatbaar is voor het genereren van informatie die niet is gebaseerd op feitelijke gegevens.
-Verbeteringstechnieken: de vermindering van de hallucinaties in GPT-4.5 wordt toegeschreven aan nieuwe toezichtstechnieken in combinatie met traditionele methoden zoals begeleide verfijning (SFT) en versterking leren van menselijke feedback (RLHF) [1]. Deze methoden helpen bij het verbeteren van de feitelijke nauwkeurigheid en betrouwbaarheid van het model.
Prestatievergelijking
-Nauwkeurigheid: in termen van nauwkeurigheid op de Personqa-gegevensset bereikt GPT-4.5 een hogere nauwkeurigheid van 78%, vergeleken met GPT-4O's 28%[2] [5]. Dit suggereert dat niet alleen GPT-4.5 hallucinaat minder, maar het biedt ook meer accurate reacties.
- Algemene betrouwbaarheid: het lagere hallucinatiepercentage en de hogere nauwkeurigheid van GPT-4.5 maken het een meer betrouwbare keuze voor toepassingen die precieze en betrouwbare informatie vereisen. Beide modellen presteren echter op dezelfde manier in bepaalde evaluaties, zoals billijkheid en bias -beoordelingen [5].
Samenvattend presteert GPT-4.5 beter dan GPT-4O in termen van hallucinatievermindering en nauwkeurigheid, waardoor het een betrouwbaardere optie is voor taken die precieze en feitelijke informatie vereisen. Beide modellen hebben echter hun sterke en zwakke punten over verschillende domeinen en evaluaties.
Citaten:
[1] https://topmostads.com/openai-release-gpt-4-5/
[2] https://assets.ctfassets.net/kftzwyauwt9/7eadv6oawhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-systal
[3] https://www.reddit.com/r/openai/comment
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-hey-compare
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
[6] https://community.openai.com/t/gpt-4-vs-gpt-4o-which-is-the-better/746991
[7] https://mashable.com/article/openai-gpt-4-5-release-How-to-try
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differenties-to-consider