GPT-4.5 έναντι GPT-4O: Βασικές βελτιώσεις στον χειρισμό αντικρουόμενων μηνυμάτων

Ποιες συγκεκριμένες βελτιώσεις έχει το GPT-4.5 πάνω από το GPT-4O στο χειρισμό αντικρουόμενων μηνυμάτων

Το GPT-4.5 καταδεικνύει συγκεκριμένες βελτιώσεις σε σχέση με το GPT-4O στον χειρισμό αντικρουόμενων μηνυμάτων μέσω της ενισχυμένης ιεραρχίας διδασκαλίας. Αυτή η λειτουργία επιτρέπει στο μοντέλο να δίνει προτεραιότητα στα μηνύματα του συστήματος σε μηνύματα χρήστη, μετριάζοντας τον κίνδυνο άμεσης ενέσεων και άλλων επιθέσεων που θα μπορούσαν να υπερισχύουν των οδηγιών ασφαλείας. Εδώ είναι οι βασικές βελτιώσεις:

1. Αξιολόγηση ιεραρχίας διδασκαλίας: Σε αξιολογήσεις όπου διαφορετικοί τύποι μηνυμάτων έρχονται σε σύγκρουση μεταξύ τους, η GPT-4.5 εκπαιδεύεται να ακολουθήσει τις οδηγίες στο μήνυμα υψηλότερης προτεραιότητας. Αυτό βοηθά το μοντέλο να χειριστεί καλύτερα σενάρια όπου οι εισόδους των χρηστών ενδέχεται να προσπαθήσουν να παρακάμψουν τα πρωτόκολλα ασφαλείας.

2. Επίλυση συγκρούσεων: Το GPT-4.5 γενικά ξεπερνά τις απόδοσης GPT-4O στις αξιολογήσεις που περιλαμβάνουν συγκρούσεις μεταξύ μηνυμάτων συστήματος και χρήστη. Αυτή η βελτίωση είναι ζωτικής σημασίας για τη διατήρηση της ασφάλειας και της τήρησης των κατευθυντήριων γραμμών σε σύνθετα σενάρια συνομιλίας.

3. Tutor Jailbreaks: Σε ένα συγκεκριμένο σενάριο όπου το μοντέλο λειτουργεί ως δάσκαλος μαθηματικών, το GPT-4.5 έχει την εντολή να μην αποκαλύψει την απάντηση σε μια ερώτηση μαθηματικών. Ενώ η GPT-4.5 δεν ξεπερνά το GPT-4O σε αυτή τη συγκεκριμένη αξιολόγηση (η ακρίβεια του GPT-4O είναι υψηλότερη), εξακολουθεί να αποδεικνύει την ανθεκτικότητα στην αντιστάθμιση των προσπαθειών να εξαπατηθεί στην παροχή μη εξουσιοδοτημένων πληροφοριών.

4. Φράση και προστασία κωδικού πρόσβασης: Το GPT-4.5 δείχνει ισχυρή απόδοση στην προστασία συγκεκριμένων φράσεων ή κωδικών πρόσβασης από την αποκάλυψη μέσω των προτροπών των χρηστών. Αυτό υποδεικνύει καλύτερη ικανότητα διατήρησης της εμπιστευτικότητας και τη συμμόρφωση με τις κατευθυντήριες γραμμές ασφαλείας σε σύγκριση με ορισμένα προηγούμενα μοντέλα.

Συνολικά, οι βελτιώσεις της GPT-4,5 στο χειρισμό των αντικρουόμενων μηνυμάτων αποτελούν μέρος των ευρύτερων βελτιώσεων της ασφάλειας, της απόχρωσης και της συνεργασίας, καθιστώντας την πιο αποτελεσματική στη διατήρηση ασφαλών και κατάλληλων αλληλεπιδράσεων [1] [3].

Αναφορές:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-extrained-everything-you-ne-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-compare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5-συναισθηματικά-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-should- know-about-the-update-and-new-tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/