GPT-4.5: ปรับปรุงประสิทธิภาพในการจัดการคำแนะนำที่ขัดแย้งกัน

ประสิทธิภาพของ GPT-4.5 เปรียบเทียบกับเวอร์ชันก่อนหน้านี้ในการจัดการคำแนะนำที่ขัดแย้งกันอย่างไร

GPT-4.5 แสดงให้เห็นถึงประสิทธิภาพที่ดีขึ้นในการจัดการคำแนะนำที่ขัดแย้งกันเมื่อเทียบกับเวอร์ชันก่อนหน้าโดยเฉพาะอย่างยิ่งผ่านลำดับชั้นการเรียนการสอนที่ได้รับการปรับปรุง คุณลักษณะนี้ช่วยให้โมเดลสามารถจัดลำดับความสำคัญของข้อความระบบผ่านอินพุตของผู้ใช้ลดความเสี่ยงที่เกี่ยวข้องกับการฉีดทันทีและการโจมตีอื่น ๆ ที่อาจแทนที่คำแนะนำด้านความปลอดภัย

ในการประเมินผลที่เกี่ยวข้องกับประเภทข้อความที่ขัดแย้งกัน GPT-4.5 โดยทั่วไปมีประสิทธิภาพสูงกว่า GPT-4O โมเดลได้รับการฝึกฝนให้ทำตามคำแนะนำในข้อความลำดับความสำคัญสูงสุดซึ่งช่วยในสถานการณ์ที่ระบบและข้อความของผู้ใช้ขัดแย้งกัน ตัวอย่างเช่นในสถานการณ์ที่โมเดลได้รับคำสั่งไม่ให้ตอบคำถามทางคณิตศาสตร์ GPT-4.5 แสดงการปฏิบัติตามคำแนะนำของระบบเหล่านี้ได้ดีกว่าเมื่อเทียบกับ GPT-4O แม้ว่าจะไม่เกิน GPT-4O1 ในการประเมินทั้งหมด [1]

นอกจากนี้ GPT-4.5 ได้รับการประเมินในสถานการณ์ที่ต้องปกป้องวลีหรือรหัสผ่านเฉพาะจากการถูกเปิดเผยผ่านการแจ้งเตือนของผู้ใช้ ในการประเมินเหล่านี้ GPT-4.5 ทำงานได้ดีแสดงให้เห็นถึงความสามารถในการรักษาความปลอดภัยและปฏิบัติตามคำแนะนำของระบบแม้ว่าจะต้องเผชิญกับอินพุตของผู้ใช้ที่ขัดแย้งกัน [1]

อย่างไรก็ตามในขณะที่ GPT-40.5 ปรับปรุงเมื่อรุ่นก่อนหน้าในการจัดการคำแนะนำที่ขัดแย้งกัน แต่ก็ยังเผชิญกับความท้าทายในสถานการณ์ที่ซับซ้อนบางอย่าง ประสิทธิภาพของโมเดลในการประเมินผลทีมสีแดงซึ่งจำลองการกระตุ้นการตอบสนองของฝ่ายตรงข้ามแสดงให้เห็นว่ามันสามารถสร้างผลลัพธ์ที่ไม่ปลอดภัยในบางกรณีแม้ว่าโดยทั่วไปจะทำงานได้ดีกว่า GPT-4O ในการทดสอบที่ท้าทายเหล่านี้ [1]

โดยรวมแล้วการปรับปรุงของ GPT-4.5 ในการจัดการคำแนะนำที่ขัดแย้งกันทำให้เป็นตัวเลือกที่น่าเชื่อถือมากขึ้นสำหรับแอปพลิเคชันที่ต้องปฏิบัติตามแนวทางความปลอดภัยและคำแนะนำของระบบอย่างเข้มงวด

การอ้างอิง:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models- เปรียบเทียบ
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-his-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consers
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r/openai/comments/18monbs/GPT_4_HAS_BEEN_TONED_DOWN_SINGINIFINGE_AND/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-reasoning