ประสิทธิภาพของ GPT-4.5 สำหรับความรู้โดยปริยายและคำถามการแก้ไขปัญหาเมื่อเทียบกับ GPT-4 สะท้อนให้เห็นถึงความก้าวหน้าในการจัดการแบบสอบถามที่ซับซ้อนและเหมาะสม ในขณะที่ตัวชี้วัดเฉพาะสำหรับความรู้โดยปริยายและการแก้ไขปัญหาไม่ได้มีรายละเอียดในข้อมูลที่มีอยู่การปรับปรุงที่สำคัญหลายประการใน GPT-4.5 สามารถเน้นได้:
1. ลำดับชั้นการเรียนการสอนและความปลอดภัย: GPT-4.5.5 ได้รับการฝึกฝนให้ปฏิบัติตามลำดับชั้นการเรียนการสอนซึ่งช่วยลดความเสี่ยงของการฉีดทันทีและการโจมตีอื่น ๆ ซึ่งหมายความว่าจะดีกว่าในคำแนะนำของระบบต่อไปนี้เกี่ยวกับข้อความผู้ใช้ที่ขัดแย้งกันเพิ่มความสามารถในการจัดการกับสถานการณ์ที่ซับซ้อนซึ่งอาจต้องแก้ไขปัญหา [1] ในทางตรงกันข้าม GPT-4 ไม่มีการปรับปรุงเฉพาะนี้ที่กล่าวถึงในวรรณคดี
2. คำถามที่คลุมเครือ: GPT-4.5 แสดงความแม่นยำต่ำกว่าเล็กน้อยสำหรับคำถามที่คลุมเครือเมื่อเทียบกับ GPT-4O (รุ่น GPT-4) โดยมีความแม่นยำ 0.95 สำหรับ GPT-4O เทียบกับ 0.95 สำหรับ GPT-4 และ 0.95 สำหรับ GPT-4.5 อย่างไรก็ตามประสิทธิภาพของ GPT-4.5 ในคำถามที่ไม่คลุมเครือนั้นคล้ายกับ GPT-4O ซึ่งบ่งชี้ว่าทั้งสองรุ่นจัดการกับการสืบค้นที่ชัดเจนได้อย่างมีประสิทธิภาพ [1]
3. ความรู้และการแก้ไขปัญหาโดยปริยาย: ในขณะที่ไม่มีการวัดเฉพาะสำหรับความรู้และการแก้ไขปัญหาโดยปริยาย แต่ความสามารถที่ดีขึ้นของ GPT-4.5 ในการจัดการกับข้อความที่ขัดแย้งกันและลำดับชั้นการสอนที่ได้รับการปรับปรุงแนะนำว่าอาจทำงานได้ดีขึ้น ในทางกลับกัน GPT-4 เป็นที่รู้จักกันดีในเรื่องความเข้าใจภาษาที่เพิ่มขึ้นและความสามารถในการให้คำตอบที่แม่นยำยิ่งขึ้นสำหรับการสืบค้นที่ซับซ้อน [2]
4. ความสามารถหลายอย่าง: GPT-4 ซึ่งเป็นฐานสำหรับ GPT-4.5.5 นำเสนอการปรับปรุงที่สำคัญมากกว่า GPT-3.5 ในความสามารถหลายรูปแบบและการจัดการแบบสอบถามที่ซับซ้อน GPT-4 สามารถประมวลผลและตอบสนองต่ออินพุตข้อมูลที่กว้างขึ้นทำให้มีความหลากหลายมากขึ้นสำหรับงานที่อาจเกี่ยวข้องกับการแก้ไขปัญหาหรือความรู้โดยปริยาย [2] [6]
โดยสรุปในขณะที่ GPT-4.5 สร้างขึ้นบนจุดแข็งของ GPT-4 โดยเฉพาะอย่างยิ่งในการจัดการคำแนะนำที่ซับซ้อนและโปรโตคอลความปลอดภัยประสิทธิภาพเฉพาะของความรู้โดยปริยายและคำถามการแก้ไขปัญหาไม่ได้มีรายละเอียดอย่างกว้างขวาง อย่างไรก็ตามลำดับชั้นการเรียนการสอนที่ได้รับการปรับปรุงและการจัดการข้อความที่ขัดแย้งกันดีขึ้นแนะนำว่าอาจมีประสิทธิภาพมากขึ้นในสถานการณ์การแก้ไขปัญหาที่เหมาะสมยิ่งขึ้น
การอ้างอิง:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhhhxlaehuyu7db/64e9f7916d3581ba4b5d0f0a6c5098d1/gpt-4-5_system
[2] https://datasciencedojo.com/blog/gpt-3-5-vs-gpt-4-debate/
[3] https://www.opastpublishers.com/open-access-articles/evaluating-errors-and-improving-performance-of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/pmc11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow-up-to-instructions-and-tasks/613298
[6] https://www.aubergine.co/insights/gpt-3-5-vs-gpt-4-an-in-in-depth-analysis-of-openais-language-models
[7] https://www.marketingaiinstitute.com/blog/the-ai-show-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-biggest-differences-to-consers