GPT-4.5 รวมเอาเทคนิคการจัดตำแหน่งใหม่ที่ปรับขนาดได้ซึ่งออกแบบมาเพื่อเพิ่มความร่วมมือของมนุษย์โดยการปรับปรุงความเข้าใจของแบบจำลองเกี่ยวกับความต้องการและความตั้งใจของมนุษย์ เทคนิคเหล่านี้ช่วยให้การฝึกอบรมโมเดลที่มีขนาดใหญ่และทรงพลังยิ่งขึ้นโดยใช้ข้อมูลที่ได้มาจากโมเดลขนาดเล็กซึ่งเป็นสิ่งสำคัญเนื่องจากโมเดล AI มีความซับซ้อนมากขึ้นและแก้ปัญหาที่กว้างขึ้น [1] [3] [7]
การปรับปรุงคีย์
1. การจัดสรร: เทคนิคการจัดตำแหน่งใหม่ช่วยเพิ่มความสามารถในการจัดสรรการควบคุมของ GPT-4.5 ทำให้ผู้ใช้สามารถแนะนำโมเดลได้อย่างมีประสิทธิภาพยิ่งขึ้นไปสู่ผลลัพธ์ที่ต้องการ สิ่งนี้มีความสำคัญอย่างยิ่งสำหรับงานที่ต้องมีการควบคุมการตอบสนองของแบบจำลองที่แม่นยำ [1] [3]
2. การทำความเข้าใจเกี่ยวกับความแตกต่างกันนิดหน่อย: GPT-4.4.5 แสดงให้เห็นถึงความเข้าใจที่ดีขึ้นเกี่ยวกับความแตกต่างกันนิดหน่อยช่วยให้สามารถจัดการด้านการสื่อสารที่ซับซ้อนและละเอียดอ่อนได้อย่างมีประสิทธิภาพมากขึ้น การปรับปรุงนี้มีความสำคัญสำหรับงานที่ต้องมีความเห็นอกเห็นใจและความฉลาดทางอารมณ์ [1] [3]
3. การสนทนาตามธรรมชาติ: ความสามารถของโมเดลในการมีส่วนร่วมในการสนทนาตามธรรมชาติได้รับการปรับปรุงอย่างมีนัยสำคัญ ตอนนี้สามารถตอบสนองอย่างสังหรณ์ใจและเอาใจใส่มากขึ้นทำให้การมีปฏิสัมพันธ์รู้สึกเหมือนมนุษย์มากขึ้น สิ่งนี้เป็นประโยชน์สำหรับแอปพลิเคชันเช่นการบริการลูกค้าการให้คำปรึกษาและโครงการสร้างสรรค์ร่วมกัน [1] [3] [7]
กระบวนการฝึกอบรม
GPT-4.5 ได้รับการพัฒนาโดยใช้วิธีการแบบดั้งเดิมเช่นการปรับแต่งแบบควบคุม (SFT) และการเรียนรู้การเสริมแรงจากข้อเสนอแนะของมนุษย์ (RLHF) ซึ่งคล้ายกับที่ใช้สำหรับ GPT-4O แบบจำลองนี้ได้รับการฝึกอบรมล่วงหน้าและได้รับการฝึกอบรมหลังชุดข้อมูลที่หลากหลายรวมถึงข้อมูลที่เปิดเผยต่อสาธารณะข้อมูลที่เป็นกรรมสิทธิ์จากพันธมิตรและชุดข้อมูลที่กำหนดเองที่พัฒนาขึ้นภายใน บริษัท ข้อมูลการฝึกอบรมที่หลากหลายนี้ก่อให้เกิดความสามารถในการสนทนาที่แข็งแกร่งและความรู้ในโลกที่กว้าง [1] [3]
ความฉลาดทางอารมณ์
แบบจำลองแสดงถึงความฉลาดทางอารมณ์ที่เพิ่มขึ้นช่วยให้สามารถตรวจจับและตอบสนองอย่างเหมาะสมกับตัวชี้นำทางสังคม สิ่งนี้ทำให้การมีปฏิสัมพันธ์เป็นธรรมชาติและเอาใจใส่มากขึ้นซึ่งเป็นประโยชน์อย่างยิ่งสำหรับการใช้งานที่ต้องใช้การสื่อสารที่เหมาะสม [7]
โดยรวมแล้วเทคนิคการจัดตำแหน่งใหม่ใน GPT-4.5 มีจุดมุ่งหมายเพื่อสร้างเครื่องมือ AI ที่ทำงานร่วมกันและใช้งานง่ายมากขึ้นซึ่งสามารถปรับให้สอดคล้องกับความตั้งใจและความต้องการของมนุษย์ได้ดีขึ้นทำให้เหมาะสำหรับการใช้งานที่หลากหลาย
การอ้างอิง:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-dructure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bbbbpaper-conference.pdf.pdf.pdf.pdf.pdf.pdf.pdf.pdf.pdf
[7] https://topmostads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1