วิธีที่ GPT-4.5 จัดการข้อความที่ขัดแย้งกับลำดับชั้นการเรียนการสอนและการปรับแต่งอย่างละเอียด

GPT-4.5 ใช้เทคนิคต่าง ๆ ในการจัดการข้อความที่ขัดแย้งกันโดยเฉพาะอย่างยิ่งผ่านระบบลำดับชั้นการเรียนการสอน ลำดับชั้นนี้กำหนดลำดับความสำคัญสำหรับข้อความเพื่อให้มั่นใจว่าข้อความระบบจะได้รับการจัดลำดับความสำคัญมากกว่าข้อความผู้ใช้ประวัติการสนทนาและผลลัพธ์ของเครื่องมือ [1] [2]

ลำดับชั้นคำสั่ง

1. ข้อความระบบกับข้อความผู้ใช้: GPT-4.5 ได้รับการฝึกฝนให้ทำตามคำแนะนำในข้อความระบบผ่านข้อความผู้ใช้ที่ขัดแย้งกัน สิ่งนี้มีความสำคัญในสถานการณ์ที่ผู้ใช้อินพุตอาจพยายามแทนที่แนวทางความปลอดภัยหรือกฎการจัดรูปแบบที่กำหนดโดยระบบ [1] [2]

2. การแก้ไขข้อขัดแย้ง: แบบจำลองได้รับการประเมินเกี่ยวกับความสามารถในการแก้ไขความขัดแย้งระหว่างข้อความประเภทต่างๆ ตัวอย่างเช่นหากข้อความของระบบสั่งให้โมเดลไม่เปิดเผยวลีหรือรหัสผ่านเฉพาะและข้อความผู้ใช้พยายามที่จะหลอกโมเดลให้ทำเช่นนั้น GPT-4.5 ได้รับการออกแบบมาเพื่อปฏิบัติตามคำแนะนำของข้อความของระบบ [1]

3. การฝึกอบรมและการประเมินผล: GPT-4.5 ได้รับการฝึกอบรมและการประเมินผลอย่างกว้างขวางเพื่อให้แน่ใจว่าสามารถจัดการกับสถานการณ์ที่ซับซ้อนซึ่งข้อความและข้อความของผู้ใช้ขัดแย้งกัน ซึ่งรวมถึงสถานการณ์ที่โมเดลต้องเลือกระหว่างการปฏิบัติตามคำสั่งระบบหรือคำขอของผู้ใช้ที่ขัดแย้งกับ [1] [2]

การปรับแต่งการปรับแต่ง (SFT)

GPT-4.5 ยังใช้การปรับแต่งการปรับแต่ง (SFT) ซึ่งเกี่ยวข้องกับการฝึกอบรมแบบจำลองในตัวอย่างเฉพาะที่มีข้อความที่ขัดแย้งกันอยู่ เทคนิคนี้ช่วยปรับปรุงความสามารถของโมเดลในการรับรู้และจัดลำดับความสำคัญคำแนะนำระบบผ่านอินพุตของผู้ใช้เพิ่มประสิทธิภาพในการจัดการสถานการณ์ที่ขัดแย้งกัน [3]

เทคนิคการจัดตำแหน่งใหม่

นอกจากนี้ GPT-4.5 ได้รวมเอาเทคนิคการจัดตำแหน่งใหม่ที่ช่วยเพิ่มความเข้าใจในการตั้งค่าและความตั้งใจของมนุษย์ เทคนิคเหล่านี้ช่วยให้โมเดลตีความบริบทและความตั้งใจที่อยู่เบื้องหลังทั้งระบบและข้อความผู้ใช้ได้ดีขึ้นทำให้สามารถตัดสินใจได้มากขึ้นเมื่อจัดการกับความขัดแย้ง [5]

โดยรวมแล้ววิธีการของ GPT-4.5 ในการจัดการข้อความที่ขัดแย้งกันรวมวิธีการฝึกอบรมขั้นสูงด้วยลำดับชั้นที่มีโครงสร้างของคำแนะนำเพื่อให้แน่ใจว่าแบบจำลองจัดลำดับความสำคัญด้านความปลอดภัยและการปฏิบัติตามแนวทางของระบบ

การอ้างอิง:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.08745v1
[3] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-his-model-is
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-dructure/1025132
[5] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[6] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[7] https://openai.com/index/introducing-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/18monbs/GPT_4_HAS_BEEN_TONED_DOWN_SINGINIFINGE_AND/

GPT-4.5 ใช้เทคนิคใดในการจัดการข้อความที่ขัดแย้งกัน

ลำดับชั้นคำสั่ง

การปรับแต่งการปรับแต่ง (SFT)

เทคนิคการจัดตำแหน่งใหม่