Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Πώς συγκρίνεται η απόδοση του GPT-4.5 με το GPT-4O όσον αφορά τις ψευδαισθήσεις


Πώς συγκρίνεται η απόδοση του GPT-4.5 με το GPT-4O όσον αφορά τις ψευδαισθήσεις


Τα GPT-4.5 και GPT-4O είναι και τα δύο προχωρημένα γλωσσικά μοντέλα που αναπτύχθηκαν από το OpenAI, το καθένα με ξεχωριστές βελτιώσεις έναντι των προκατόχων τους. Κατά τη σύγκριση των επιδόσεών τους όσον αφορά τις ψευδαισθήσεις, η GPT-4.5 καταδεικνύει σημαντική μείωση των ποσοστών ψευδαίσθησης σε σύγκριση με το GPT-4O.

Μείωση ψευδαίσθησης στο GPT-4.5

-Ποσοστό ψευδαίσθησης: Το GPT-4,5 έχει ποσοστό ψευδαίσθησης περίπου 19% όταν δοκιμάζεται στο σύνολο δεδομένων PersonQA, το οποίο αποτελεί σημαντική βελτίωση έναντι του ποσοστού του GPT-4O περίπου 52% [2] [5]. Αυτή η μείωση υποδεικνύει ότι το GPT-4.5 είναι πιο αξιόπιστη και λιγότερο επιρρεπής στη δημιουργία πληροφοριών που δεν βασίζονται στα πραγματικά δεδομένα.
-Τεχνικές βελτίωσης: Η μείωση των ψευδαισθήσεων στο GPT-4.5 αποδίδεται σε νέες τεχνικές εποπτείας σε συνδυασμό με παραδοσιακές μεθόδους όπως η εποπτευόμενη τελειοποίηση (SFT) και η μάθηση ενίσχυσης από την ανθρώπινη ανατροφοδότηση (RLHF) [1]. Αυτές οι μέθοδοι συμβάλλουν στην ενίσχυση της πραγματικής ακρίβειας και αξιοπιστίας του μοντέλου.

Σύγκριση απόδοσης

-Ακρίβεια: Όσον αφορά την ακρίβεια στο σύνολο δεδομένων PersonQA, η GPT-4.5 επιτυγχάνει υψηλότερη ακρίβεια 78%, σε σύγκριση με το 28%της GPT-4O [2] [5]. Αυτό υποδηλώνει ότι όχι μόνο το GPT-4,5 παραισθήται λιγότερο, αλλά παρέχει επίσης ακριβέστερες απαντήσεις.
- Συνολική αξιοπιστία: Το χαμηλότερο ποσοστό ψευδαισθήσεων και η υψηλότερη ακρίβεια της GPT-4,5 καθιστούν μια πιο αξιόπιστη επιλογή για εφαρμογές που απαιτούν ακριβείς και αξιόπιστες πληροφορίες. Ωστόσο, και τα δύο μοντέλα εκτελούν ομοίως σε ορισμένες αξιολογήσεις, όπως αξιολογήσεις δικαιοσύνης και μεροληψίας [5].

Συνοπτικά, το GPT-4,5 ξεπερνά το GPT-4O όσον αφορά τη μείωση και την ακρίβεια, καθιστώντας την πιο αξιόπιστη επιλογή για εργασίες που απαιτούν ακριβείς και πραγματικές πληροφορίες. Ωστόσο, και τα δύο μοντέλα έχουν τα πλεονεκτήματα και τις αδυναμίες τους σε διαφορετικούς τομείς και αξιολογήσεις.

Αναφορές:
[1] https://topmotads.com/openai-release-gpt-4-5/
[2] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[3] https://www.reddit.com/r/openai/comments/1izq37r/gpt45s_low_hallucination_rate_is_a_gamechanger/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-compare
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
[6] https://community.openai.com/t/gpt-4-vs-gpt-4o-which-is-the-better/746991
[7] https://mashable.com/article/openai-gpt-4-5-release-how-try
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider