Kā GPT-5 samazina halucinācijas ātrumu: datu veidošana, apmācība un atgriezeniskās saites stratēģijas

GPT-5 halucinācijas ātrumu samazinājums tiek attiecināts gan uz tā apmācības datu veidošanu, gan uzlabotām apmācības metodoloģijām. Openai ir atklāti ziņojis, ka GPT-5 atbildes ir līdz 45% mazāk iespējamas faktiskas kļūdas, salīdzinot ar GPT-4O, un ar uzlaboto "spriešanas" režīmu faktiskās kļūdas samazinās par aptuveni 80% salīdzinājumā ar iepriekšējo O3 modeli. Halucināciju nomākšana GPT-5 nav vienas datu kopas rezultāts, bet gan sarežģīts datu kopas salikšanas process, filtrēšana, nepārtraukta pēc apmācības ar cilvēku atgriezenisko saiti un ārējo faktisko pārbaudes resursu integrāciju.

Datu kvalitātes un kuratoru stratēģija

Openai pirmais pīlārs pret halucinācijām GPT-5 ir paplašinātu, augstas kvalitātes un kurinātu datu kopu izmantošana. Tas nozīmē:
- Avota dati, visticamāk, tiks pārbaudīti un cienījami.
- Tiek pieliktas skaidras pūles, lai noņemtu vai samazinātu zināmu neuzticamu, neobjektīvu vai ļaunprātīgu saturu pirms apmācības un datu atsvaidzināšanas ciklu laikā.
-Lietotāju nodalītie dati tiek filtrēti, anonimizēti un pārbaudīti pēc faktiskuma pirms iekļaušanas uzraudzītā precizēšanā vai atlīdzības modelēšanā.

Lai vēl vairāk samazinātu halucinācijas risku, Openai ir izvietojis plašus datu tīrīšanas procesus, lai identificētu un izslēgtu trokšņainu, pretrunīgu vai sintētisku saturu, kas varētu izraisīt kļūdas modeļa izejās.

pēc apmācības un pastiprināšana no cilvēku atsauksmēm (RLHF)

Cilvēka atsauksmes ir galvenā GPT-5 arhitektūrā. Modelis iziet intensīvas pastiprināšanas mācīšanās kārtas no cilvēku atsauksmēm (RLHF), kurās cilvēku vērtētāji:
- Tiesneša iznākums par faktisko pareizību, saskaņotību un saskaņošanu ar lietotāja nodomu.
- Nodrošiniet pāra preferences modeļu paaudzēm, atalgojošai precizitātei un informativitātei, vienlaikus sodot halucinācijas.
- Šie signāli veido pamatu atalgojuma modeļiem, kas vēl vairāk optimizē GPT-5, lai dotu priekšroku faktiski pareizai pabeigšanai.

Turklāt RLHF tiek papildināts ar automatizētiem faktiskuma pakāpēm, kas apstiprināti pret cilvēku spriedumu, lai mērogotu halucināciju noteikšanu. Šie greideri kalpo gan kā kvantitatīvi vērtējumu kritēriji, gan kā nepārtrauktas apmācības sastāvdaļa, kas nodrošina liela mēroga, ātras atgriezeniskās saites cilpas, kas pārsniedz tikai cilvēku anotāciju.

Novērtēšanas etaloni un stresa pārbaude

Lai izmērītu halucinācijas, GPT-5 ir stingri pārbaudīts uz jauniem publiskiem un iekšējiem faktiskuma etaloniem, piemēram, Longfact (jēdzieni un objekti) un faktucore (faktu meklēšanas piedāvājumi). Novērtēšanas ietvars ir vērsts uz grūtākām, beztermiņa uzvednēm un tālsatiksmes saturu-vietām, kurās halucinācijas iepriekš uzplauka. Pēc Openai teiktā, "GPT-5 domāšana" rada apmēram sešas reizes mazāk halucināciju nekā O3 šajos uzdevumos.

GPT-5 tiek novērtēts arī reālās pasaules ražošanas trafikā un specializētās testu komplektos, kur tās spēja pareizi atzīt zināšanu nepilnības un izvairīties no izgatavošanas tieši un uzlabot. Piemēram, modeļa atteikšanās izgudrot neeksistējošus aktīvus multimodālos apstākļos ir ievērojami uzlabojusies, salīdzinot ar iepriekšējām paaudzēm.

Arhitektūras un apmācības iejaukšanās

Vairākas dziļākas iejaukšanās apmācības mērķa halucināciju laikā:

-Pārdomātu ķēdes pamudināšanas un strukturētā argumentācija ir iebūvēta pirms apmācības un precizēšanas fāzēs, ļaujot modelim radīt izskaidrojamākas un pamatotākas izejas, nevis pārliecinātus pieņēmumus.
-Drošas pabeigšanas paradigma aizstāj vecāku uz atteikumu balstītu drošības modeli, apmācību GPT-5, lai sniegtu noderīgas, ierobežotas atbildes vai pārredzami paziņotu tās robežas un argumentāciju, kad tā nevar droši atbildēt.
-Rīku izmantošana un iegūšana, kas ir augsta uz ģenerēšanu (RAG): GPT-5 ir sistemātiski apmācīts piesaistīt tīmekļa meklēšanu un ārējus faktu pārbaudes rīkus vaicājumiem, kuriem nepieciešamas jaunākās vai ļoti specifiskas zināšanas. Tas krasi samazina halucināciju risku uz neskaidriem vai ātri mainīgiem subjektiem.
- Sikofances samazināšana: GPT-5 Curation cauruļvads skaidri apkopo datus, kas izstrādāti, lai notvertu modeļus, kas ir vienošanās kļūdas, vērtējot atbildes uz sycophancy un šo punktu izmantošanu kā negatīvu atlīdzību RLHF laikā, tieši uzbrūkot “halucinācijai pēc vienošanās problēmas.

reālās pasaules rezultāti un ierobežojumi

Neskatoties uz šiem sasniegumiem, GPT-5 nav pilnībā imūns pret halucinācijām. Piemēram:
-Ziņotais halucinācijas ātrums sarežģītiem, beztermiņa uzdevumiem (ko mēra ar etaloniem, piemēram, vienkārša QA), joprojām ir nozīmīgs, it īpaši, ja sistēma tiek pārtraukta no tiešraides faktu pārbaudes rīkiem.
- Piekļuve tīmekļa meklēšanai ievērojami samazina kļūdu līmeni, parādot hibrīda apmācības nozīmi (apvienojot statiskos datus ar izguvi) halucināciju mērenā.
- Dažas radošas vai abstraktas uzvednes turpina apstrīdēt sistēmas pamatnes mehānismus.

Nepārtraukti atjauninājumi un sabiedrības atsauksmes

GPT-5 sistēma tiek barota ar pastāvīgiem sabiedrības un reālistikas datiem, ar atgriezeniskās saites mehānismiem, kas ļauj ātri izlikt atklāt atklātas halucinācijas un uzlabot uzlabojumus gan datu filtrēšanas, gan atlīdzības funkciju projektēšanā. Openai atklāti atzīst nepieciešamību pēc turpmākiem uzlabojumiem, īpaši tādās jomās kā veselības aprūpe un likumi, kur kļūdu tolerancei jābūt minimālai.

Galveno kuratoru posmu kopsavilkums

Lai sintezētu, halucināciju samazināšana GPT-5 rodas no šādiem savstarpēji saistītiem procesiem:

1. Rūpīga pirms apmācības datu izvēle un filtrēšana, uzsverot iegūšanu no cienījamām datu bāzēm un atjaunināta faktiskā satura uzturēšanu.
2. Trokšņainā, neuzticama vai neobjektīva satura izslēgšana datu kopas montāžas laikā, ko pastiprina automatizēta un manuāla pārskatīšana vairākos posmos.
3. Pastiprināšanas mācīšanās un nepārtrauktas atsauksmes, kuru pamatā ir liela mēroga cilvēku un automatizēta faktu un patiesuma vērtēšana.
4. Novērtējums pret stabiliem faktiskajiem faktiskajiem etaloniem-gan statiskiem, gan reāliem pasaulē-precīzu halucināciju līmeni un veidu dažādos apstākļos.
5. Pēc apmācības intervences, ieskaitot drošākas pabeigšanas stratēģijas, skaidru saiknes nomākšanu un spēcīgu integrāciju ar izguves vai uz instrumentiem balstītām zināšanām.
6. Iteratīvā dzīvā noregulēšana no atgriezeniskās saites ražošanas un sarkanās komandas, nodrošinot, ka ātri tiek atklāti un risināti jauni halucināciju noplūdes.

Šīs stratēģijas kolektīvi iezīmē pāreju no pasīvas mazināšanas uz aktīvu, spēcīgu halucinācijas apspiešanu **, lai gan uzdevums joprojām ir mainīgs, un tam nepieciešama modrība, nepārtraukti atjauninājumi un pētniecības atvērtība, lai nākotnē sasniegtu vēl zemāku kļūdu robežu.

Kuras apmācības datu kopas vai kuratoru pakāpieni samazina halucinācijas GPT-5