Hiệu suất của GPT-4.5 về kiến thức ngầm và các câu hỏi khắc phục sự cố, so với GPT-4, phản ánh những tiến bộ trong việc xử lý các truy vấn phức tạp và sắc thái. Mặc dù các số liệu cụ thể cho kiến thức ngầm và sự cố không được trình bày chi tiết trong các thông tin có sẵn, một số cải tiến chính trong GPT-4.5 có thể được nhấn mạnh:
1. Hệ thống phân cấp và an toàn hướng dẫn: GPT-4.5 đã được đào tạo để tuân thủ một hệ thống phân cấp hướng dẫn, giúp giảm thiểu nguy cơ tiêm kịp thời và các cuộc tấn công khác. Điều này có nghĩa là tốt hơn trong việc làm theo các hướng dẫn hệ thống về các thông điệp người dùng mâu thuẫn, tăng cường khả năng xử lý các tình huống phức tạp có thể yêu cầu khắc phục sự cố [1]. Ngược lại, GPT-4 không có sự tăng cường cụ thể này được đề cập trong tài liệu.
2. Các câu hỏi mơ hồ: GPT-4.5 cho thấy độ chính xác thấp hơn một chút đối với các câu hỏi mơ hồ so với GPT-4O (phiên bản GPT-4), với độ chính xác là 0,95 cho GPT-4O so với 0,95 cho GPT-4 và 0,95 cho GPT-4,5. Tuy nhiên, hiệu suất của GPT-4.5 trên các câu hỏi không rõ ràng tương tự như GPT-4O, chỉ ra rằng cả hai mô hình đều xử lý các truy vấn rõ ràng một cách hiệu quả [1].
3. Kiến thức ngầm và xử lý sự cố: Trong khi các số liệu cụ thể cho kiến thức ngầm và sự cố không được cung cấp, khả năng cải thiện của GPT-4.5 để xử lý các thông điệp mâu thuẫn và hệ thống phân cấp hướng dẫn nâng cao của nó cho thấy nó có thể thực hiện tốt hơn trong kịch bản đòi hỏi sự hiểu biết và khắc phục sự cố. Mặt khác, GPT-4 được biết đến với khả năng hiểu ngôn ngữ và khả năng cung cấp câu trả lời chính xác hơn cho các truy vấn phức tạp [2].
4. Khả năng đa phương thức: GPT-4, là cơ sở cho GPT-4.5, cung cấp những cải tiến đáng kể so với GPT-3.5 trong các khả năng đa phương thức và xử lý các truy vấn phức tạp. GPT-4 có thể xử lý và đáp ứng với phạm vi đầu vào dữ liệu rộng hơn, làm cho nó linh hoạt hơn đối với các tác vụ có thể liên quan đến việc khắc phục sự cố hoặc kiến thức ngầm [2] [6].
Tóm lại, trong khi GPT-4.5 xây dựng dựa trên các thế mạnh của GPT-4, đặc biệt là trong việc xử lý các hướng dẫn phức tạp và các giao thức an toàn, hiệu suất cụ thể của nó đối với kiến thức ngầm và các câu hỏi khắc phục sự cố không được chi tiết. Tuy nhiên, hệ thống phân cấp hướng dẫn nâng cao của nó và cải thiện việc xử lý các thông điệp mâu thuẫn cho thấy nó có thể hiệu quả hơn trong các kịch bản khắc phục sự cố sắc thái.
Trích dẫn:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7EaDv6OaWHhXLAehUYu7Db/64e9f7916d3581ba4b5d0f0a6c5098d1/GPT-4-5_System_Card_2272025.pdf
[2] https:
[3] https://www.opastpublishers.com/open-access-articles/evaluating-errors-and-improving-performance-of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow-up-to-instructions-and-tasks/613298
[6] https://www.aubergine
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/GPT-35-vs-GPT-4-Biggest-differences-to-consider