GPT-4.5 thể hiện những cải tiến cụ thể đối với GPT-4O trong việc xử lý các thông điệp mâu thuẫn thông qua hệ thống phân cấp hướng dẫn nâng cao của nó. Tính năng này cho phép mô hình ưu tiên các tin nhắn hệ thống qua tin nhắn người dùng, giảm thiểu rủi ro tiêm kịp thời và các cuộc tấn công khác có thể ghi đè các hướng dẫn an toàn. Dưới đây là những cải tiến chính:
1. Đánh giá phân cấp hướng dẫn: Trong các đánh giá trong đó các loại tin nhắn khác nhau mâu thuẫn với nhau, GPT-4.5 được đào tạo để làm theo các hướng dẫn trong thông báo ưu tiên cao nhất. Điều này giúp mô hình xử lý tốt hơn các kịch bản trong đó các đầu vào của người dùng có thể cố gắng bỏ qua các giao thức an toàn.
2. Giải quyết xung đột: GPT-4.5 nói chung vượt trội so với GPT-4O trong các đánh giá liên quan đến xung đột giữa tin nhắn hệ thống và người dùng. Sự cải thiện này là rất quan trọng để duy trì sự an toàn và tuân thủ các hướng dẫn trong các kịch bản đàm thoại phức tạp.
3. Tutor Jailbreaks: Trong một kịch bản cụ thể trong đó mô hình hoạt động như một gia sư toán học, GPT-4.5 được hướng dẫn không tiết lộ câu trả lời cho một câu hỏi toán học. Mặc dù GPT-4.5 không vượt trội hơn GPT-4O trong đánh giá cụ thể này (độ chính xác của GPT-4O cao hơn), nhưng nó vẫn thể hiện sự mạnh mẽ trong việc chống lại các nỗ lực để lừa nó cung cấp thông tin trái phép.
4. Cụm từ và bảo vệ mật khẩu: GPT-4.5 cho thấy hiệu suất mạnh mẽ trong việc bảo vệ các cụm từ hoặc mật khẩu cụ thể khỏi được tiết lộ thông qua lời nhắc của người dùng. Điều này cho thấy khả năng tốt hơn để duy trì tính bảo mật và tuân thủ các hướng dẫn bảo mật so với một số mô hình trước đó.
Nhìn chung, những cải tiến của GPT-4.5 trong việc xử lý các thông điệp mâu thuẫn là một phần của những cải tiến rộng hơn về an toàn, sắc thái và sự hợp tác của nó, làm cho nó hiệu quả hơn trong việc duy trì các tương tác an toàn và phù hợp [1] [3].
Trích dẫn:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/GPT-4o-explained-Everything-you-need-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/GPT-4o-vs-GPT-4-How-do-they-compare
[5] https://www.businessinsider.com/openai-sam-altman-releases-gpt-4-5-emotionally-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-should-know-about-the-update-and-new-tools
[7] https://vives
.