GPT-5, halüsinasyon oranlarını nasıl azaltır: Veri küratörlüğü, eğitim ve geri bildirim stratejileri

GPT-5'in halüsinasyon oranlarındaki azalması hem eğitim veri küratörlüğü hem de ileri eğitim metodolojilerine atfedilmektedir. Openai, GPT-5 yanıtlarının GPT-4O'ya kıyasla olgusal hatalar içerme olasılığının% 45'e kadar daha az olduğunu ve gelişmiş "muhakeme" modu ile gerçek hataların önceki O3 modeline göre yaklaşık% 80 oranında düştüğünü bildirmiştir. GPT-5'teki halüsinasyonların baskılanması, tek bir veri kümesinin sonucu değil, insan geri bildirimleriyle sürekli eğitim sonrası veri kümesi birleştirme, filtreleme, sürekli eğitim sonrası kaynakların entegrasyonu.

Veri Kalitesi ve Kürasyon Stratejisi

Openai'nin GPT-5'teki halüsinasyonlara karşı ilk direği, genişletilmiş, yüksek kaliteli ve küratörlü veri kümelerinin kullanılmasıdır. Bu şu anlama gelir:
- Kaynak verilerin doğrulanması ve saygın olma olasılığı daha yüksektir.
- Eğitim öncesi ve veri yenileme döngüleri sırasında bilinen güvenilmez, önyargılı veya kötü niyetli içeriği kaldırmak veya en aza indirmek için açık çaba sarf edilmiştir.
-Kullanıcı ile katkıda bulunan veriler, denetimli ince ayar veya ödül modellemesine dahil edilmeden önce facticity için filtrelenir, anonimleştirilir ve incelenir.

Halüsinasyon riskini daha da azaltmak için Openai, modelin çıktılarındaki hataları teşvik edebilecek gürültülü, çelişkili veya sentetik içeriği tanımlamak ve hariç tutmak için kapsamlı veri temizleme süreçleri kullanmıştır.

İnsan Geri Bildirimlerinden Eğitim Sonrası ve Takviyesi (RLHF)

İnsan geri bildirimi GPT-5'in mimarisinde merkezidir. Model, insan derecelendiricilerinin bulunduğu insan geri bildirimlerinden (RLHF) yoğun takviye öğreniminden geçiyor:
- Çıktıları gerçek doğruluk, tutarlılık ve kullanıcı niyetiyle hizalama konusunda yargılayın.
- Halüsinasyonları cezalandırırken model nesiller, ödüllendirici doğruluk ve bilgilendirme konusunda ikili tercihler sağlayın.
- Bu sinyaller, GPT-5'i gerçekte doğru tamamlamaları tercih etmek için daha da optimize eden ödül modellerinin temelini oluşturur.

Ek olarak, RLHF, halüsinasyonların tespitini ölçeklendirmek için insan yargısına karşı doğrulayan otomatik gerçeklik sınıf öğrencileri tarafından artırılır. Bu sınıf öğrencileri hem değerlendirmelerde kantitatif bir kıstas hem de sürekli eğitimin bir bileşeni olarak hizmet eder ve sadece insan ekleminin ötesinde büyük ölçekli, hızlı geri bildirim döngüleri sağlar.

Değerlendirme kriterleri ve stres testi

Halüsinasyonları ölçmek için GPT-5, LongFact (kavramlar ve nesneler) ve factScore (gerçek arayan istemler) gibi yeni kamu ve iç gerçeklik kıyaslamaları üzerinde titizlikle streslidir. Değerlendirme çerçevesi, halüsinasyonların daha önce geliştiği alanları daha sert, açık uçlu istemleri ve uzun biçimli içeriği hedefler. Openai'ye göre, "GPT-5 Düşünme" bu görevlerde O3'ten yaklaşık altı kat daha az halüsinasyon üretiyor.

GPT-5 ayrıca gerçek dünyadaki üretim trafiğinde ve bilgi boşluklarını doğru bir şekilde kabul etme ve imalatlardan kaçınma yeteneğinin doğrudan ölçüldüğü ve geliştirildiği özel test setlerinde de değerlendirilir. Örneğin, modelin multimodal ortamlarda var olmayan varlıkları icat etmeyi reddetmesi, önceki nesillere kıyasla belirgin bir şekilde iyileşmiştir.

Mimari ve Eğitim Müdahaleleri

Eğitim hedef halüsinasyonları sırasında birkaç derin müdahale:

-Düşünce zinciri, eğitim öncesi ve ince ayar aşamalarına yerleştirilmiştir, bu da modelin kendinden emin varsayımlardan ziyade daha açıklanabilir ve topraklanmış çıktılar üretmesini sağlar.
-Güvenli tamamlamalar paradigması, eski ret tabanlı güvenlik modelinin yerini alır, GPT-5'i yardımcı, sınırlı yanıtlar sağlamak veya güvenli bir şekilde cevaplayamadığı zaman sınırlarını ve muhakemesini şeffaf bir şekilde iletir.
-Araç kullanımı ve geri alınan üretim üretimi (RAG): GPT-5, güncel veya son derece spesifik bilgi gerektiren sorgular için web aramasından ve harici gerçek kontrol araçlarından yararlanmak için sistematik olarak eğitilmiştir. Bu, belirsiz veya hızlı gelişen konularda halüsinasyon riskini büyük ölçüde azaltır.
- Sycophancy Azaltma: GPT-5'in küratörlük boru hattı, “anlaşma” hatalarındaki modelleri tuzağa düşürmek, syopophany için cevapları puanlamak ve bu puanları RLHF sırasında olumsuz bir ödül olarak kullanarak, Â Halüsinasyona Anlaşma sorunu ile doğrudan saldırı için tasarlanmış verileri açıkça toplar.

Gerçek dünya sonuçları ve sınırlamaları

Bu ilerlemelere rağmen, GPT-5 halüsinasyonlara tamamen bağışık değildir. Örneğin:
-Karmaşık, açık uçlu görevler için bildirilen halüsinasyon oranı (basit KG gibi kriterlerle ölçülür), özellikle sistem canlı bilgi kontrol araçlarından kesildiğinde önemli kalır.
- Web aramasına erişim, hat oranlarını önemli ölçüde azaltır, bu da halüsinasyonlarda hibrit eğitiminin (statik küratörlü verileri erişimle birleştirme) önemini gösterir.
- Bazı yaratıcı veya soyut istemler sistemin topraklama mekanizmalarına meydan okumaya devam eder.

Sürekli güncellemeler ve topluluk geri bildirimi

GPT-5'in sistemi, keşfedilen halüsinasyonların hızlı bir şekilde yamalanmasına ve hem veri filtreleme hem de ödül fonksiyon tasarımında iyileştirmelerin piyasaya sürülmesini sağlayan geri bildirim mekanizmaları ile devam eden topluluk ve gerçek kullanıcı verileri ile beslenir. Openai, özellikle hata toleransının minimum olması gereken sağlık ve hukuk gibi yüksek bahis alanlarında daha fazla iyileştirme ihtiyacını açıkça kabul eder.

Temel Kürasyon Adımlarının Özeti

Sentezlemek için, GPT-5'teki halüsinasyonların azaltılması aşağıdaki birbirine bağlı süreçlerden kaynaklanır:

1. Saygın veritabanlarından kaynak kullanımı ve güncel olgusal içeriğin korunmasına vurgu yaparak, titiz eğitim öncesi veri seçimi ve filtreleme.
2. Veri kümesi montajı sırasında gürültülü, güvenilmez veya önyargılı içeriğin hariç tutulması, otomatik ve manuel inceleme ile birçok aşamada güçlendirilmiştir.
3. Büyük ölçekli insana ve gerçeklik ve doğruluk için otomatik derecelendirmeye dayanan takviye öğrenimi ve sürekli geri bildirim.
4. Çeşitli koşullar altında halüsinasyonların kesin oranını ve türünü ölçen, hem statik hem de gerçek dünya gibi sağlam olgusallık ölçütlerine karşı değerlendirme.
5. Daha güvenli tamamlama stratejileri, açık sycophancy baskılama ve geri alma veya araç tabanlı bilgi ile güçlü entegrasyon dahil olmak üzere eğitim sonrası müdahaleler.
6. Halüsinasyonların yeni “sızıntılarının” hızlı bir şekilde tespit edilmesini ve ele alınmasını sağlayarak üretim geri bildirimi ve kırmızı takımdan yinelemeli canlı ayarlama.

Bu stratejiler toplu olarak pasif hafifletmeden aktif, sağlam halüsinasyon baskılanmasına ** Â, görevin gelişmekte olmasına rağmen, gelecekte daha düşük hata marjları elde etmek için uyanıklık, sürekli güncellemeler ve araştırma açıklığı gerektiren bir değişime işaret ediyor.

Hangi eğitim veri kümeleri veya küratörlük adımları GPT-5'te halüsinasyonları keser