GPT-4.5 contre GPT-4O: Réduction des hallucinations et comparaison de précision

Comment les performances de GPT-4.5 se comparent-elles à GPT-4O en termes d'hallucinations

GPT-4.5 et GPT-4O sont tous deux des modèles de langage avancé développés par OpenAI, chacun avec des améliorations distinctes par rapport à leurs prédécesseurs. Lorsque vous comparez leurs performances en termes d'hallucinations, GPT-4.5 démontre une réduction significative des taux d'hallucination par rapport au GPT-4O.

Réduction des hallucinations en GPT-4.5

- Taux d'hallucination: GPT-4.5 a un taux d'hallucination d'environ 19% lorsqu'il est testé sur l'ensemble de données PersonQA, ce qui est une amélioration substantielle par rapport au taux de GPT-4O d'environ 52% [2] [5]. Cette réduction indique que GPT-4.5 est plus fiable et moins sujet à la génération d'informations qui ne sont pas fondées sur des données factuelles.
- Techniques d'amélioration: la réduction des hallucinations de GPT-4.5 est attribuée à de nouvelles techniques de supervision combinées à des méthodes traditionnelles telles que le réglage fin supervisé (SFT) et l'apprentissage par renforcement de la rétroaction humaine (RLHF) [1]. Ces méthodes aident à améliorer la précision et la fiabilité factuelles du modèle.

Comparaison des performances

- Précision: En termes de précision sur l'ensemble de données PersonQA, GPT-4.5 atteint une précision plus élevée de 78%, par rapport aux 28% de GPT-4O [2] [5]. Cela suggère que non seulement GPT-4.5 hallucine moins, mais qu'il fournit également des réponses plus précises.
- Fiabilité globale: le taux d'hallucination inférieur et la précision plus élevée de GPT-4.5 en font un choix plus fiable pour les applications nécessitant des informations précises et dignes de confiance. Cependant, les deux modèles fonctionnent de manière similaire dans certaines évaluations, telles que les évaluations d'équité et de biais [5].

En résumé, GPT-4.5 surpasse GPT-4O en termes de réduction et de précision des hallucinations, ce qui en fait une option plus fiable pour les tâches qui nécessitent des informations précises et factuelles. Cependant, les deux modèles ont leurs forces et leurs faiblesses dans différents domaines et évaluations.

Citations:
[1] https://topstads.com/openai-release-gpt-4-5/
[2] https://assets.ctfassets.net/kftzwdyauwt9/7Eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_2272025.pdff
[3] https://www.reddit.com/r/openai/comments/1izq37r/gpt45s_low_hallucination_rate_is_a_gamechanger/
[4] https://www.techtarget.com/searchentiterpriseai/feature/gpt-4ovs-gpt-4-how-o-yy-compare
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
[6] https://community.openai.com/t/gpt-4-vs-gpt-4o-which-is-the-better/746991
[7] https://mashable.com/article/openai-gpt-4-5-release-how-try
[8] https://www.techtarget.com/searchsenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider