GPT-4.5 og GPT-4O er begge avancerede sprogmodeller udviklet af Openai, hver med forskellige forbedringer i forhold til deres forgængere. Når man sammenligner deres præstation med hensyn til hallucinationer, demonstrerer GPT-4.5 en signifikant reduktion i hallucinationshastigheder sammenlignet med GPT-4O.
Hallucination Reduktion i GPT-4.5
-Hallucinationsgrad: GPT-4.5 har en hallucinationshastighed på ca. 19%, når den testes på Personqa-datasættet, hvilket er en væsentlig forbedring i forhold til GPT-4Os sats på ca. 52% [2] [5]. Denne reduktion indikerer, at GPT-4.5 er mere pålidelig og mindre tilbøjelig til at generere information, der ikke er baseret på faktiske data.
-Forbedringsteknikker: Reduktionen i hallucinationer i GPT-4.5 tilskrives nye tilsynsteknikker kombineret med traditionelle metoder som overvåget finjustering (SFT) og forstærkningslæring fra human feedback (RLHF) [1]. Disse metoder hjælper med at forbedre modellens faktiske nøjagtighed og pålidelighed.
Performance -sammenligning
-Nøjagtighed: Med hensyn til nøjagtighed på PersonQA-datasættet opnår GPT-4.5 en højere nøjagtighed på 78%sammenlignet med GPT-4Os 28%[2] [5]. Dette antyder, at GPT-4.5 hallucinerer ikke kun mindre, men det giver også mere nøjagtige svar.
- Samlet pålidelighed: Den nedre hallucinationsgrad og højere nøjagtighed af GPT-4.5 gør det til et mere pålideligt valg til applikationer, der kræver præcis og pålidelig information. Begge modeller fungerer imidlertid på lignende måde i visse evalueringer, såsom retfærdighed og bias -vurderinger [5].
I sammendraget overgår GPT-4.5 GPT-4O med hensyn til reduktion af hallucination og nøjagtighed, hvilket gør det til en mere pålidelig mulighed for opgaver, der kræver præcis og faktuel information. Imidlertid har begge modeller deres styrker og svagheder på tværs af forskellige domæner og evalueringer.
Citater:
[1] https://topmostads.com/openai-release-trpt-4-5/
[2] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[3] https://www.reddit.com/r/openai/comments/1izq37r/gpt45s_low_hallucination_rate_is_a_gamechanger/
)
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
)
[7] https://mashable.com/article/openai-trpt-4-5-relsease-how-to-try
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-trpt-4-biggest-differences-to- og konsider