Η απόδοση του GPT-4,5 σχετικά με τις σιωπηρές γνώσεις και τα ερωτήματα αντιμετώπισης προβλημάτων, σε σύγκριση με το GPT-4, αντικατοπτρίζει τις εξελίξεις στο χειρισμό σύνθετων και λεπτών ερωτημάτων. Ενώ οι συγκεκριμένες μετρήσεις για τη σιωπηρή γνώση και την αντιμετώπιση προβλημάτων δεν περιγράφονται λεπτομερώς στις διαθέσιμες πληροφορίες, μπορούν να επισημανθούν αρκετές βασικές βελτιώσεις στο GPT-4.5:
1. Η ιεραρχία και η ασφάλεια των οδηγιών: Το GPT-4.5 έχει εκπαιδευτεί για να τηρήσει μια ιεραρχία εντολών, η οποία βοηθά στην άμβλυνση του κινδύνου άμεσων ενέσεων και άλλων επιθέσεων. Αυτό σημαίνει ότι είναι καλύτερο να ακολουθήσετε τις οδηγίες του συστήματος σχετικά με τα αντικρουόμενα μηνύματα χρήστη, βελτιώνοντας την ικανότητά του να χειρίζεται σύνθετα σενάρια που ενδέχεται να απαιτούν αντιμετώπιση προβλημάτων [1]. Αντίθετα, η GPT-4 δεν έχει αυτή τη συγκεκριμένη ενίσχυση που αναφέρεται στη βιβλιογραφία.
2. Αμφισβήτητες ερωτήσεις: Το GPT-4.5 δείχνει ελαφρώς χαμηλότερη ακρίβεια σε διφορούμενες ερωτήσεις σε σύγκριση με το GPT-4O (έκδοση του GPT-4), με ακρίβεια 0,95 για GPT-4O έναντι 0,95 για GPT-4 και 0,95 για GPT-4,5. Ωστόσο, η απόδοση του GPT-4.5 σε σαφείς ερωτήσεις είναι παρόμοια με την GPT-4O, υποδεικνύοντας ότι και τα δύο μοντέλα χειρίζονται αποτελεσματικά τα σαφή ερωτήματα [1].
3. Σκηνή γνώση και αντιμετώπιση προβλημάτων: Ενώ δεν παρέχονται συγκεκριμένες μετρήσεις για σιωπηρή γνώση και αντιμετώπιση προβλημάτων, η βελτιωμένη ικανότητα του GPT-4.5 να χειρίζεται τα αντικρουόμενα μηνύματα και την ενισχυμένη ιεραρχία διδασκαλίας να υποδηλώνει ότι μπορεί να αποδώσει καλύτερα σε σενάρια που απαιτούν αποχρωματισμένη κατανόηση και αντιμετώπιση προβλημάτων. Η GPT-4, από την άλλη πλευρά, είναι γνωστή για την ενισχυμένη κατανόηση της γλώσσας και την ικανότητά του να παρέχει πιο ακριβείς απαντήσεις σε σύνθετα ερωτήματα [2].
4. Πολυτροπικές δυνατότητες: Η GPT-4, η οποία είναι η βάση για το GPT-4.5, προσφέρει σημαντικές βελτιώσεις έναντι της GPT-3.5 σε πολυτροπικές δυνατότητες και χειρισμού σύνθετων ερωτημάτων. Το GPT-4 μπορεί να επεξεργαστεί και να ανταποκριθεί σε ένα ευρύτερο φάσμα εισροών δεδομένων, καθιστώντας την πιο ευέλικτη για εργασίες που ενδέχεται να περιλαμβάνουν την αντιμετώπιση προβλημάτων ή σιωπηρή γνώση [2] [6].
Συνοπτικά, ενώ η GPT-4.5 βασίζεται στα πλεονεκτήματα της GPT-4, ιδιαίτερα στον χειρισμό σύνθετων οδηγιών και των πρωτοκόλλων ασφαλείας, οι ειδικές επιδόσεις της στις σιωπηρές γνώσεις και τα ερωτήματα αντιμετώπισης προβλημάτων δεν είναι εκτενώς λεπτομερώς. Ωστόσο, η ενισχυμένη ιεραρχία διδασκαλίας και ο βελτιωμένος χειρισμός των αντικρουόμενων μηνυμάτων υποδηλώνουν ότι θα μπορούσε να είναι πιο αποτελεσματική σε σενάρια προβλημάτων.
Αναφορές:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[2] https://datasciencedojo.com/blog/gpt-3-5-vs-gpt-4-debate/
[3] https://www.opastpublishers.com/open-access-articles/evaluating-errors-and-improving-performance- of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow -to-stustructions-and-tasks/613298
[6] https://www.aubergine.co/insights/gpt-3-5-vs-gpt-4-an-in-depth-analysis- of openais-language-models
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consider