GPT-5 ลดภาพหลอนได้อย่างไร: นวัตกรรมทางสถาปัตยกรรมและความก้าวหน้าในการฝึกอบรม

GPT-5 ช่วยลดภาพหลอนอย่างมีนัยสำคัญเมื่อเทียบกับ GPT-4 แสดงให้เห็นถึงการปรับปรุงที่สำคัญในความถูกต้องและความน่าเชื่อถือตามข้อเท็จจริงในมาตรฐานที่หลากหลายโดเมนและสถานการณ์ในโลกแห่งความเป็นจริง การลดลงนี้ไม่ได้เป็นผลมาจากการดัดแปลงเพียงครั้งเดียว แต่เป็นการทำงานร่วมกันของนวัตกรรมทางสถาปัตยกรรมวิธีการฝึกอบรมที่ดีขึ้นโปรโตคอลการประเมินขั้นสูงและระบบความปลอดภัยที่เพิ่มขึ้น สิ่งต่อไปนี้คือการตรวจสอบที่ครอบคลุมของกลไกและหลักการที่อยู่เบื้องหลังแนวโน้มที่ลดลงของ GPT-5 สำหรับภาพหลอนเมื่อเทียบกับ GPT-4

คำจำกัดความของภาพหลอนใน LLMS

แบบจำลองภาษาขนาดใหญ่ (LLMS) บางครั้งสามารถสร้างภาพหลอน ** ข้อความที่น่าเชื่อถือและคล่องแคล่วซึ่งไม่ถูกต้องจริงหรือไม่ได้มีพื้นฐานในข้อมูลพื้นฐาน ภาพหลอนรวมถึงข้อเท็จจริงที่ประดิษฐ์ขึ้นการอ้างเหตุผลที่ไม่ถูกต้องและตรรกะที่ไม่ถูกต้อง การปรับปรุงของ GPT-5 มุ่งเป้าไปที่ปัญหาเหล่านี้โดยตรงทำให้สามารถวัดได้มากขึ้นในการใช้เหตุผลแบบปลายเปิดและการตอบคำถามที่เป็นข้อเท็จจริง

เปรียบเทียบเกณฑ์มาตรฐานเชิงปริมาณ

การเปรียบเทียบ GPT-5 โดยตรงกับ GPT-4 เผยให้เห็นการลดลงอย่างสิ้นเชิงในอัตราการเกิดภาพหลอน:
-ตามมาตรฐานความเป็นจริงเช่น LongFact และ FactScore GPT-5 แสดงอัตราการเกิดภาพหลอนต่ำสุดที่ 0.7 1.0%เมื่อเทียบกับ 4.5 ของ GPT-4 5.1%
-HealthBench ซึ่งประเมินความแม่นยำทางการแพทย์แสดงอัตราการเกิดภาพหลอนของ GPT-5 ต่ำกว่า 2%ซึ่งต่ำกว่า GPT-4O 12%ของ GPT-4O
-การวิเคราะห์เกี่ยวกับการสืบค้นผู้ใช้ทั่วไป (สถานการณ์จริง) พบว่าอัตราความผิดพลาดของ GPT-5 ลดลงเหลือ 4.8% เทียบกับมากกว่า 20% สำหรับ GPT-4O
-แหล่งข้อมูลอิสระหลายแหล่งยืนยันการลดลง 45% ของข้อผิดพลาดข้อเท็จจริงเมื่อเทียบกับ GPT-4O โดยเน้นการก้าวกระโดดในการต่อสายดินและการแก้ไขด้วยตนเอง

ผลกำไรที่สอดคล้องกันดังกล่าวข้ามโดเมนเน้นการเปลี่ยนแปลงพื้นฐาน: การออกแบบและการฝึกอบรมของ GPT-5 เป้าหมายแหล่งที่มาของภาพหลอนก่อนหน้านี้อย่างเป็นระบบ

นวัตกรรมทางสถาปัตยกรรม

การกำหนดเส้นทางอินพุตและการรวมที่รอบคอบ

GPT-5 แนะนำสถาปัตยกรรมแบบครบวงจรที่เส้นทางแบบไดนามิกแจ้งให้ระบบย่อยผู้เชี่ยวชาญเฉพาะทางหรือหัวสิ่งนี้ช่วยให้การใช้เหตุผลตามเป้าหมายและการตรวจสอบข้อเท็จจริงที่ความละเอียดมากกว่าการออกแบบเสาหินของ GPT-4 โดยการแยกคำขอของผู้ใช้ที่ซับซ้อนอย่างชาญฉลาดระหว่างโมดูลที่เหมาะสม GPT-5 สามารถตรวจสอบเนื้อหาข้ามแหล่งข้อมูลหลายแหล่งรวมและลดการแพร่กระจายของข้อเท็จจริงที่ไม่ได้รับการสนับสนุนหรือประดิษฐ์ ระบบการกำหนดเส้นทางนี้เป็นรากฐานของการจัดการที่เหนือกว่าของ GPT-5 ของงานที่มีความซับซ้อนซับซ้อนหรือแปลกใหม่

ปรับปรุงโหมดการคิด

คุณลักษณะที่สำคัญใน GPT-5 คือโหมดการคิดที่ชัดเจนซึ่งสั่งให้แบบจำลองการพิจารณาภายในรวบรวมหลักฐานและจัดระเบียบข้อมูลก่อนที่จะสร้างคำตอบภายนอก ในมาตรฐานอัตราการเกิดภาพหลอนของ GPT-5 เมื่อการคิดต่ำกว่าในโหมดที่ไม่มีโครงสร้างอย่างรวดเร็วซึ่งแสดงให้เห็นว่าการสร้างแบบจำลองการให้เหตุผลที่มีโครงสร้าง (ตรงข้ามกับรุ่นอิสระ) สร้างผลลัพธ์ที่เชื่อถือได้มากขึ้น ผู้ใช้และนักวิจัยสังเกตว่าโหมดการคิดของ GPT-5 มีโอกาสน้อยกว่าการตั้งค่าภาพหลอนน้อยกว่าการตั้งค่ารุ่นที่เร็วที่สุดของ GPT-4O

โมเดลความลึกและหน้าต่างบริบท

GPT-5 ขยายหน้าต่างบริบทและความลึกของโมเดลทำให้สามารถอ้างอิงข้อมูลเพิ่มเติมและรักษาความเชื่อมโยงกันได้ตลอดเวลา ซึ่งหมายความว่ามันจะทำให้เกิดข้อเท็จจริงมากขึ้นในใจลดการดริฟท์และทำให้มีโอกาสน้อยที่จะสูญเสียพล็อตซึ่งมักจะทำให้เกิดภาพหลอนในรุ่นก่อนหน้าเมื่อความยาวอินพุตเข้าใกล้หรือเกินขีด จำกัด หน้าต่าง

ปรับปรุงข้อมูลและวิธีการฝึกอบรม

การเลือกและการกรองข้อมูลคุณภาพสูง

OpenAI และนักวิจัยที่เกี่ยวข้องมีการปรับปรุงการจัดการข้อมูลสำหรับ GPT-5 ทั้งในขั้นตอนการฝึกอบรมก่อนและการปรับแต่ง สิ่งนี้เกี่ยวข้องกับ:
- การแยกแหล่งที่มาของเว็บที่ไม่น่าเชื่อถืออย่างเข้มงวดข้อมูลที่ล้าสมัยและข้อมูลสังเคราะห์ที่มีข้อผิดพลาดโดยธรรมชาติหรือเนื้อหาสมมติ
- การรวมชุดข้อมูลที่ดูแลโดยมุ่งเน้นไปที่สาขาวิชาที่เป็นข้อเท็จจริง (วิทยาศาสตร์การแพทย์กฎหมาย)
- การกรองที่ก้าวร้าวมากขึ้นสำหรับการอ้างอิงการอ้างอิงและการตรวจสอบย้อนกลับ

การเลือกข้อมูลอย่างระมัดระวังดังกล่าวหมายถึง GPT-5 ได้สัมผัสกับเสียงรบกวนน้อยลงและรูปแบบที่ทำให้เข้าใจผิดน้อยลงในระหว่างการเรียนรู้ครั้งแรกลดพฤติกรรมของภาพหลอน

การเรียนรู้การเสริมแรงขั้นสูงและข้อเสนอแนะของมนุษย์ (RLHF)

GPT-5 ใช้ประโยชน์จากการเรียนรู้การเสริมแรงจากข้อเสนอแนะของมนุษย์ (RLHF) ในระดับที่ใหญ่กว่าและละเอียดยิ่งขึ้น ผู้ประเมินผลของมนุษย์ไม่เพียงจัดอันดับผลลัพธ์สำหรับความช่วยเหลือทั่วไป แต่โดยเฉพาะแท็กและลงโทษข้อเท็จจริงภาพหลอนโดยเฉพาะการเรียกร้องที่ไม่ได้รับการสนับสนุนและข้อผิดพลาดที่ชัดเจน ในระยะต่อมาผู้เชี่ยวชาญโดเมนมีส่วนช่วยในการติดฉลาก (โดยเฉพาะอย่างยิ่งในโดเมนที่มีสเตคสูงเช่นสุขภาพหรือวิทยาศาสตร์) เปิดเผยแบบจำลองการแก้ไขอย่างเข้มงวดไม่ใช่แค่ร้อยแก้วที่น่าสนใจ

นอกจากนี้การเรียนรู้การเสริมแรงยังมีหลายวัตถุประสงค์:
- ความถูกต้องตามข้อเท็จจริง
- การแสดงออกที่เหมาะสมของความไม่แน่นอนของ epistemic (พูดว่าฉันไม่รู้)
- แหล่งที่มาของแหล่งที่มาและการตรวจสอบย้อนกลับ

การศึกษาที่อ้างถึงหลายครั้งโปรดทราบว่า GPT-5 ปฏิเสธที่จะเห็นภาพหลอนในสถานการณ์ที่คลุมเครือบ่อยกว่า GPT-4 แทนที่จะเลือกรับข้อจำกัดความรับผิดชอบหรือแจ้งให้ตรวจสอบแหล่งข้อมูลภายนอก

การอัปเดตและการเรียนรู้ออนไลน์อย่างต่อเนื่อง

ในกรณีที่ GPT-4 เป็นส่วนใหญ่ที่ได้รับการฝึกฝนเมื่อได้รับการฝึกฝน GPT-5 รวมองค์ประกอบของการเรียนรู้อย่างต่อเนื่อง ** การอัปเดตเป็นระยะจากข้อมูลใหม่ที่เชื่อถือได้และการแก้ไขข้อผิดพลาดที่รู้จัก การเรียนรู้แบบออนไลน์นี้หมายถึงรูปแบบที่เป็นปัญหาไม่คงอยู่ได้นานทำให้เกิดภาพหลอนในวิชาที่ใหม่กว่า (เหตุการณ์หลังการฝึกอบรมเทคโนโลยีใหม่) หายากกว่ามาก

โปรโตคอลการประเมินที่แข็งแกร่ง

การขยายและการทดสอบความเป็นจริงที่ผ่านการทดสอบความเครียด

Openai ลงทุนในชุดการประเมินที่กว้างขึ้นและลึกซึ้งยิ่งขึ้นสำหรับ GPT-5 เน้นด้วยการแจ้งเตือนที่ท้าทายยิ่งขึ้นเหมาะสมและเปิดกว้างในโดเมนข้อเท็จจริง:
- longfact, factscore และ HealthBench” ไม่เพียง แต่เป็นข้อเท็จจริงสั้น ๆ แต่ยังขยายเหตุผลและการบำรุงรักษาบริบท
- QA อย่างง่าย ** การทดสอบแบบจำลองทั้งในโหมดที่เชื่อมต่อกับเว็บและโหมดออฟไลน์เปิดเผยจุดอ่อนในการฝึกอบรมที่แยกได้
- การแจ้งเตือนในโลกแห่งความเป็นจริงนั้นสะท้อนให้เห็นถึงการรับส่งข้อมูลการใช้งานการผลิตไม่ใช่แค่คำถามทดสอบทางวิชาการ

การทดสอบที่หลากหลายเหล่านี้ช่วยให้ OpenAI สามารถระบุกรณีขอบได้ที่ GPT-4 จะมีแนวโน้มที่จะมีแนวโน้มที่จะเก็งกำไรหรือการขยายตัวมากเกินไปและบังคับให้ขึ้นใหม่หรือปรับ GPT-5 เพื่อแทนที่แนวโน้มเหล่านั้น

การตรวจสอบและแก้ไขหลังการปรับใช้

ด้วยการผลิต telemetry และคำติชมของผู้ใช้ OpenAI สามารถตรวจจับและแก้ไขเหตุการณ์ภาพหลอนได้ไม่นานหลังจากการปรับใช้แบบจำลอง การวนซ้ำอย่างรวดเร็วนี้ปิดลูปข้อเสนอแนะระหว่างประสบการณ์ผู้ใช้และความน่าเชื่อถือของแบบจำลองโดยใช้การแก้ไขสำหรับการแก้ไขที่ไม่ถูกต้องหรือข้อผิดพลาดถาวรด้วยความเร็วที่ไม่เคยเกิดขึ้นมาก่อน

ความปลอดภัยความไม่แน่นอนและกลไกการปฏิเสธ

การสอบเทียบความไม่แน่นอนของ epistemic

จุดเด่นอย่างหนึ่งของความน่าเชื่อถือที่เหนือกว่าของ GPT-5 คือความสามารถในการแสดงความไม่แน่นอนและมีคุณสมบัติการเรียกร้องของตัวเอง แทนที่จะสร้างคำตอบที่มั่นใจ แต่ไม่ได้รับการสนับสนุน (ภาพหลอน) GPT-5 ได้รับการฝึกฝนและปรับเป็น:
- ยอมรับเมื่อไม่มีการเข้าถึงความรู้ในปัจจุบันและตรวจสอบได้
- ส่งเสริมให้ผู้ใช้ปรึกษาแหล่งข้อมูลหลักหรือแหล่งที่เชื่อถือได้
- ระบุและเน้นการเรียกร้องที่ไม่ชัดเจนโต้เถียงหรือโต้แย้ง

การสอบเทียบด้วยตนเองนี้เป็นจุดอ่อนในรุ่นก่อนหน้า ด้วยการสร้างแบบจำลองความไม่แน่นอนอย่างชัดเจนในทั้งสถาปัตยกรรมและวัตถุประสงค์การฝึกอบรม GPT-5 มีประสิทธิภาพเหนือกว่ารุ่นก่อนด้วยความซื่อสัตย์เกี่ยวกับข้อ จำกัด ของตัวเอง

การตรวจสอบข้อเท็จจริงอัตโนมัติ

GPT-5 รวมเลเยอร์การตรวจสอบข้อเท็จจริงภายในซึ่งเอาต์พุตที่สร้างขึ้นแบบจำลองจะถูกตั้งค่าสถานะเป็นความน่าจะเป็นสำหรับการตรวจสอบฐานข้อมูลที่รู้จักหรือเมื่อมีแหล่งข้อมูลเว็บแบบเรียลไทม์ หากไม่สามารถยืนยันข้อเท็จจริงได้เอาต์พุตจะถูกระงับเขียนใหม่ด้วยคำเตือนหรือแจ้งให้ผู้ใช้ตรวจสอบทรัพยากรภายนอก กลไกอัตโนมัตินี้จะลดโอกาสในการส่งคำสั่งภาพหลอนผ่านไปยังผลลัพธ์สุดท้าย

การกรองเอาต์พุตที่รับรู้ถึงความปลอดภัย

ในกรณีที่ GPT-4 และโมเดลก่อนหน้านี้ส่งคืนข้อมูลที่เป็นไปได้ แต่มีความเสี่ยงเป็นครั้งคราว (เช่นในการสอบถามด้านสุขภาพหรือกฎหมาย) GPT-5 ใช้การกรองขั้นสูงสำหรับหัวข้อที่มีความเสี่ยงสูง การปรับปรุงเลเยอร์ความปลอดภัยข้ามการตรวจสอบคำตอบที่มีผลกระทบสูงระงับภาพหลอนที่น่าจะเป็นและปฏิเสธเนื้อหาการเก็งกำไรเมื่อเงินเดิมพันของผู้ใช้สูง สิ่งนี้ทำให้ GPT-5 ปลอดภัยกว่าสำหรับการแชททั่วไป แต่สำหรับการใช้งานอย่างจริงจัง

หลักฐานการปฏิบัติในโดเมน

ยาและสุขภาพ

แบบสอบถามทางการแพทย์เป็นสิ่งที่ท้าทายสำหรับ LLM เนื่องจากความต้องการความแม่นยำ GPT-5 ทำคะแนนได้อย่างน้อย 80% อัตราการเกิดภาพหลอนของ HealthBench ซึ่งมักจะมีประสิทธิภาพสูงกว่า GPT-4 แต่เกือบทุกรุ่นที่มีการแข่งขันในปัจจุบันมีอยู่ ผู้ตรวจสอบอิสระทราบว่า GPT-5 เป็นพันธมิตรทางความคิดที่ใช้งานอยู่การตั้งค่าสถานะเชิงรุกที่อาจเกิดขึ้นในเชิงรุกและให้คำตอบที่เป็นประโยชน์มากขึ้นการปรับปรุงที่โดดเด่นเหนือบทสรุปการเก็งกำไรของ GPT-4 บางครั้ง

การเข้ารหัสและงานด้านเทคนิค

GPT-5 ยังช่วยลดภาพหลอนอย่างมากในการเขียนโปรแกรมสร้าง API ที่ประดิษฐ์ขึ้นน้อยลงฟังก์ชั่นที่ไม่มีอยู่จริงและตัวอย่างรหัสไร้เหตุผล โมเดลแรก ๆ มีชื่อเสียงในเรื่องที่น่าเชื่อถือ แต่ก็ยังไม่ได้ใช้รหัส GPT-5 ใช้ประโยชน์จากการฝึกอบรมที่ลึกซึ้งยิ่งขึ้นและตรวจสอบข้อเท็จจริงสร้างรหัสที่แม่นยำและตระหนักถึงบริบทมากขึ้นและมีแนวโน้มที่จะตั้งค่าสถานะข้อกำหนดที่คลุมเครือก่อนที่จะตอบสนอง

ความรู้และข่าวทั่วไป

เมื่อได้รับแจ้งจากเหตุการณ์ล่าสุดหรือหัวข้อจริงที่เหมาะสมยิ่งขึ้น GPT-5 การอ้างอิงข้ามหลายแหล่งอ้างอิงข้อมูลและมักจะระบุความไม่สอดคล้องกันหรือเนื้อหาที่ล้าสมัย โดยเฉพาะอย่างยิ่งมีแนวโน้มที่จะพูดว่าฉันไม่รู้หรือแนะนำการวิจัยเพิ่มเติมในกรณีที่ขอบแทนที่จะประดิษฐ์

ข้อ จำกัด : ไม่มีภาพหลอนอย่างเต็มที่

แม้จะมีความก้าวหน้าทั้งหมดเหล่านี้ GPT-5 ก็ไม่ได้รับการรักษาด้วยภาพหลอน การวัดประสิทธิภาพอิสระและเกร็ดเล็กเกร็ดน้อยของผู้ใช้เน้นที่ถาวรแม้ว่าจะหายากข้อผิดพลาดในสถานการณ์ขอบ, โซ่การให้เหตุผลที่ซับซ้อนหรืองานที่ไม่มีข้อมูลการฝึกอบรมที่เชื่อถือได้ สำหรับผู้ใช้ที่ไม่มีการเข้าถึงที่เชื่อมต่อกับเว็บหรือในโดเมนที่ความจริงมีความคลุมเครือสูงเอาต์พุตที่ไม่ถูกต้องยังคงเกิดขึ้นแม้ว่าจะน้อยกว่าใน GPT-4 อย่างชัดเจน

สรุป: ไดรเวอร์หลักของการลดภาพหลอน

โดยสรุปปัจจัยสำคัญที่รับผิดชอบการลดลงอย่างมากของ GPT-5 ในการเกิดภาพหลอนมากกว่า GPT-4 คือ:

-สถาปัตยกรรมแบบครบวงจรที่ขับเคลื่อนด้วยผู้เชี่ยวชาญ: เส้นทางคำถามแบบไดนามิกไปยังระบบย่อยที่เหมาะสมที่สุดสำหรับการตรวจสอบข้ามและการรวมข้อเท็จจริง
- โหมด 'การคิด' ที่มีโครงสร้าง: จัดลำดับความสำคัญการใช้เหตุผลตามหลักฐานช้ากว่าการสร้างที่รวดเร็ว
- บริบทของแบบจำลองที่ขยาย: ลดการดริฟท์ที่ถูกตัดทอนและการสูญเสียรายละเอียดที่สำคัญ
- การจัดการข้อมูลที่เข้มงวดและ RLHF: กรองข้อมูลที่ไม่น่าเชื่อถืออย่างแน่นหนาและลงโทษภาพหลอนหรือความมั่นใจในการฝึกอบรมอย่างรุนแรง
-การเปรียบเทียบอย่างจริงจังและลูปข้อเสนอแนะ: การทดสอบความเครียดอย่างต่อเนื่องและแก้ไขปัญหาที่ตรวจพบได้อย่างรวดเร็วหลังการเปิดตัว
- การตรวจสอบอัตโนมัติและการสอบเทียบความไม่แน่นอน: ผู้ตรวจสอบข้อเท็จจริงภายใน, การปฏิเสธความรับผิดชอบและการปฏิเสธทำให้แบบจำลองปลอดภัยและซื่อสัตย์มากขึ้นเกี่ยวกับขีด จำกัด ของมัน

ด้วยความก้าวหน้าเหล่านี้ GPT-5 ได้ข้ามเกณฑ์ใหม่ในการลงดินข้อความสังเคราะห์การสร้างมาตรฐานใหม่สำหรับความน่าเชื่อถือในการดึงข้อมูล AI ที่ขับเคลื่อนโดย AI และการทำงานความรู้ในสถานการณ์ที่หลากหลายและเป็นจริง

ทำไม GPT-5 ถึงลดภาพหลอนเมื่อเทียบกับ GPT-4