GPT-4.5: Hiệu suất được cải thiện trong việc xử lý các hướng dẫn mâu thuẫn

Hiệu suất của GPT-4.5 so với các phiên bản trước đó trong việc xử lý các hướng dẫn mâu thuẫn

GPT-4.5 thể hiện hiệu suất được cải thiện trong việc xử lý các hướng dẫn mâu thuẫn so với các phiên bản trước, đặc biệt là thông qua hệ thống phân cấp hướng dẫn nâng cao của nó. Tính năng này cho phép mô hình ưu tiên các thông báo hệ thống hơn đầu vào của người dùng, giảm thiểu rủi ro liên quan đến việc tiêm kịp thời và các cuộc tấn công khác có thể ghi đè các hướng dẫn an toàn.

Trong các đánh giá liên quan đến các loại thông điệp mâu thuẫn, GPT-4.5 nói chung vượt trội so với GPT-4O. Mô hình được đào tạo để làm theo các hướng dẫn trong thông báo ưu tiên cao nhất, giúp trong các kịch bản trong đó tin nhắn hệ thống và người dùng xung đột. Ví dụ, trong một kịch bản mà mô hình được hướng dẫn không đưa ra câu trả lời cho một câu hỏi toán học, GPT-4.5 cho thấy sự tuân thủ tốt hơn với các hướng dẫn hệ thống này so với GPT-4O, mặc dù nó không vượt qua GPT-4O1 trong tất cả các đánh giá [1].

Ngoài ra, GPT-4.5 đã được đánh giá trong các kịch bản trong đó nó phải bảo vệ các cụm từ hoặc mật khẩu cụ thể khỏi được tiết lộ thông qua lời nhắc của người dùng. Trong các đánh giá này, GPT-4.5 thực hiện tốt, cho thấy khả năng duy trì bảo mật và làm theo các hướng dẫn của hệ thống ngay cả khi phải đối mặt với các đầu vào của người dùng mâu thuẫn [1].

Tuy nhiên, trong khi GPT-4,5 cải thiện các mô hình trước đó trong việc xử lý các hướng dẫn mâu thuẫn, nó vẫn phải đối mặt với những thách thức trong một số kịch bản phức tạp. Hiệu suất của mô hình trong các đánh giá hợp tác màu đỏ, mô phỏng sự thúc đẩy đối nghịch, cho thấy rằng nó có thể tạo ra các đầu ra không an toàn trong một số trường hợp, mặc dù nó thường hoạt động tốt hơn GPT-4O trong các thử nghiệm thách thức này [1].

Nhìn chung, các cải tiến của GPT-4.5 trong việc xử lý các hướng dẫn mâu thuẫn làm cho nó trở thành một lựa chọn đáng tin cậy hơn cho các ứng dụng yêu cầu tuân thủ nghiêm ngặt các hướng dẫn an toàn và hướng dẫn hệ thống.

Trích dẫn:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/GPT-35-vs-GPT-4-Biggest-differences-to-consider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
.
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-reasoning