Kaip GPT-5 sumažina haliucinacijas: architektūrinės naujovės ir mokymo pažanga

GPT-5 žymiai sumažina haliucinacijas, palyginti su GPT-4, parodydamas pagrindinį faktinio tikslumo ir patikimumo pagerėjimą įvairiuose etalonuose, domenuose ir realaus pasaulio scenarijuose. Šis sumažinimas yra ne vieno modifikavimo rezultatas, o architektūrinių naujovių sinergija, patobulintos mokymo metodikos, pažangių vertinimo protokolų ir patobulintų saugos sistemų. Toliau pateikiamas išsamus mechanizmų ir principų, pagrįstų GPT-5, sumažinimo haliucinacijos tendencijos, palyginti su GPT-4, tyrimas.

haliucinacijos apibrėžimas LLM

Dideli kalbos modeliai (LLM) kartais gali generuoti haliucinacijas ** įtikinamus, laisvai kalbančius teiginius, kurie faktiškai neteisingi arba nėra pagrįsti pagrindiniais duomenimis. Haliucinacijos apima pagamintus faktus, netikslius priskyrimus ir neteisingą logiką. „GPT-5“ patobulinimai tiesiogiai nukreipiami į šias problemas, todėl jis yra išmatuojamai patikimesnis tiek atvirų samprotavimų, tiek faktinių klausimų atsakymų.

Kiekybiniai etalonų palyginimai

Tiesiogiai palyginus GPT-5 su GPT-4, paaiškėja, kad haliucinacijos greičio sumažėjimas yra akivaizdus:
-Dėl faktinių etalonų, tokių kaip „Longfact“ ir „FactScore“, GPT-5 rodo, kad haliucinacijos procentas yra žemas 0,7 –1,0%, palyginti su GPT-4 4,5–5,1%.
-„Healthbench“, kuris įvertina medicininį tikslumą, rodo GPT-5 haliucinacijos procentą, mažesnį nei 2%, daug mažesnis nei GPT-4O 12-osios 15%.
-Įprastų vartotojų užklausų analizė (realaus pasaulio scenarijai) nustato, kad GPT-5 klaidų lygis sumažėja iki 4,8%, palyginti su daugiau nei 20% GPT-4O.
-Keli nepriklausomi šaltiniai patvirtina, kad faktinės klaidos sumažėjo 45%, palyginti su GPT-4o, pabrėžiant pagrindą ir savęs taisymą.

Toks nuoseklus padidėjimas visose srityse pabrėžia esminį poslinkį: GPT-5 dizainas ir treniruotės sistemingai nukreipti į ankstesnės haliucinacijos šaltinius.

Architektūrinės naujovės

apgalvotas įvesties maršrutas ir suvienijimas

„GPT-5“ pristato vieningą architektūrą, kuri dinamiškai nukreipia į specializuotą ekspertų posistemes arba „Heads.â“. Tai leidžia tikslinius samprotavimus ir faktų patikrinimą žymiai smulkesniame detalume nei GPT-4 monolitinis dizainas. Intelektualiai padalijęs sudėtingas vartotojų užklausas tarp tinkamų modulių, GPT-5 gali kryžmiškai tikrinti turinį, surinkti kelis šaltinius ir sumažinti nepalaikomų ar pagamintų faktų sklidimą. Ši maršruto parinkimo sistema pagrindžia „GPT-5“ puikų niuansų, sudėtingų ar naujų faktinių užduočių tvarkymą.

patobulintas â mąstymo režimas

Kritinė GPT-5 savybė yra aiškus mąstymo režimas, kuris nurodo modeliui iš vidaus apgalvotų, rinkti įrodymus ir organizuoti informaciją prieš pateikiant išorinį atsakymą. Esant etalonams, GPT-5 haliucinacijos greitis, kai mąstymas yra nuolat mažesnis nei greito, nestruktūrizuoto režimo, rodo, kad modeliavimas struktūrizuotas samprotavimas (priešingai nei laisvosios formos generavimas) sukuria patikimesnius rezultatus. Vartotojai ir tyrėjai pastebi, kad GPT-5 mąstymo režimas yra šešis kartus mažiau linkęs haliucinuoti nei greičiausias GPT-4O kartos parametrai.

modelio gylis ir konteksto langas

„GPT-5“ praplečia savo konteksto langą ir modelio gylį, suteikdamas galimybę jį remtis daugiau informacijos ir išlaikyti darną ilgų išėjimų. Tai reiškia, kad jis atsimena daugiau faktų â, mažinant dreifą ir todėl mažiau tikėtina, kad praranda sklypą, o tai dažnai sukelia haliucinacijas ankstesniuose modeliuose, kai įvesties ilgis artėja arba viršija jų lango ribą.

patobulinti mokymo duomenys ir metodai

aukštos kokybės duomenų pasirinkimas ir filtravimas

„Openai“ ir susiję tyrėjai patobulino GPT-5 duomenų kuravimą tiek prieš mokymo, tiek tikslinio sureguliavimo etapus. Tai apima:
- griežtesnis nepatikimų žiniatinklio šaltinių, pasenusios informacijos ir sintetinių duomenų, turinčių būdingas klaidas ar išgalvotą turinį, neįtraukimas.
- Aktyvus kuruojamų duomenų rinkinių įtraukimas, orientuotas į faktines disciplinas (mokslas, medicina, įstatymas).
- Agresyvesnis nuorodų, citatų ir atsekamumo filtravimas, atgrasantis nepalaikomas apibendrinimas.

Toks kruopštus duomenų pasirinkimas reiškia, kad GPT-5 pradiniame mokymosi metu yra veikiamas mažesnio triukšmo ir mažiau klaidinančių modelių, sumažinant haliucinacijos elgesio atspaudą.

Išplėstinis stiprinimo mokymasis ir žmonių atsiliepimai (RLHF)

„GPT-5“ svertų sustiprinimo mokymasis iš žmogaus atsiliepimų (RLHF) didesniu, granuliuotesniu mastu. Žmonių vertintojai ne tik vertina rezultatą dėl bendrojo naudingumo, bet ir ypač pažymi ir nubaudžia haliucinuotus faktus, nepalaikomus teiginius ir per dideles klaidas. Vėlesniuose etapuose domenų ekspertai prisideda prie ženklinimo (ypač aukšto lygio srityse, tokiose kaip sveikata ar mokslas), atskleisdami modelį griežtą korekciją, o ne tik į minią malonią prozą.

Be to, sustiprinimo mokymasis dabar yra daugiakalbis:
- Faktinis teisingumas
- Tinkama episteminio netikrumo išraiška (sakydamas â aš nežinau)
- Šaltinio priskyrimas ir atsekamumas

Keli cituojami tyrimai pažymi, kad GPT-5 atsisako haliucinuoti dviprasmose situacijose dažniau nei GPT-4, užuot pasirinkęs atsisakymą ar raginimus patikrinti išorinius šaltinius.

nuolatinis mokymasis ir internetinis mokymasis

Kai GPT-4 iš esmės buvo statiška, kai tik išmokė, „GPT-5“ apima nuolatinio mokymosi elementus ** periodiškai atnaujinimai iš naujos, patikimos informacijos ir aktyvią žinomų klaidų pataisą, kaip pažymėjo vartotojai ir duomenų partneriai. Ši internetinė mokymosi ciklas reiškia, kad probleminiai modeliai išlieka tiek ilgai, todėl naujesnių dalykų haliucinacijos (įvykiai po treniruotės, naujos technologijos) yra daug retesnė.

Tvirti vertinimo protokolai

Išplėsti ir stresą patikrintas faktualumo etalonas

„Openai“ investavo į platesnius, gilesnius GPT-5 vertinimo rinkinius, pabrėždami jį sudėtingesniais, niuansuotais ir atviraisiais nurodymais faktinių sričių srityje:
- „Longfact“, „FactScore“ ir „HealthBench“, apimantis ne tik trumpus faktus, bet ir išplėstinus samprotavimus bei konteksto priežiūrą.
- Paprastas QA ** modelio išbandymas tiek žiniatinkliais, tiek su „Offline“ režimais, atskleidžiant silpnybes izoliuotame mokyme.
- Realaus pasaulio raginimas nustato, atspindintį ne tik akademinių testų klausimus, bet ne tik akademinius testus.

Šie įvairūs testai leidžia „Openai“ tiksliai nustatyti krašto atvejus, kai GPT-4 būtų linkęs į spekuliaciją ar pernelyg generalizaciją ir priverstinai perkvalifikuoti arba sureguliuoti GPT-5, kad būtų panaikintos tos tendencijos.

po diegimo stebėjimo ir pataisos

Gamybos telemetrijos ir vartotojo atsiliepimų dėka „Openai“ gali aptikti ir spręsti haliucinacijos įvykius netrukus po modelio diegimo. Ši greita iteracija uždaro grįžtamojo ryšio kilpą tarp vartotojo patirties ir modelio patikimumo, pritaikydamas klaidingumo pataisymus ar nuolatines klaidas precedento neturinčiu greičiu.

saugos, netikrumo ir atsisakymo mechanizmai

episteminis netikrumo kalibravimas

Vienas pranašesnis GPT-5 patikimumo požymis yra jo sugebėjimas išreikšti netikrumą ir kvalifikuoti savo teiginius. Užuot sukūręs pasitikėjimą savimi, bet nepalaikomus atsakymus (haliucinacijas), GPT-5 yra mokomas ir suderinamas su:
- Pripažinkite, kai jam trūksta galimybių naudotis dabartinėmis, patikrinamomis žiniomis.
- Skatinkite vartotojus kreiptis į pirminius ar autoritetingus šaltinius.
- Nurodykite ir pabrėžkite dviprasmiškus, prieštaringus ar ginčijamus teiginius.

Šis savęs kalibravimas buvo silpnas ankstesnių modelių taškas. Sukūręs aiškų netikrumo modeliavimą tiek į architektūrą, tiek mokymo tikslus, GPT-5 pranoksta pirmtakus sąžiningai dėl savo apribojimų.

Automatizuotas faktų patikrinimas

„GPT-5“ apima vidinį faktų tikrinimo sluoksnį, kuriame modelio sukurti išėjimai yra tikimybiškai pažymėti, kad būtų galima patikrinti pagal žinomas duomenų bazes arba, jei įmanoma, realaus laiko žiniatinklio šaltinius. Jei faktų negalima patvirtinti, išėjimai yra slopinami, perrašomi su įspėjimais arba ragina vartotoją patikrinti išorinius išteklius. Šis automatizuotas mechanizmas smarkiai sumažina haliucinuoto teiginio tikimybę, perduodamą galutinei išvesčiai.

Sauga-AWARE išvesties filtravimas

Kai GPT-4 ir ankstesni modeliai retkarčiais grąžino patikimą, bet rizikingą informaciją (pvz., Sveikatos ar teisinėse užklausose), „GPT-5“ įgyvendina pažangų filtravimą didelės rizikos temoms. Patobulinti saugos sluoksniai kryžmiškai tikrina atsakymus į didelį poveikį, slopina tikėtinas haliucinacijas ir atsisako spekuliacinio turinio, kai vartotojo statymai yra dideli. Tai daro „GPT-5“ saugesnį ne tik bendrų pokalbių, bet ir rimtų profesionalių naudojimo būdų.

Praktiniai įrodymai visose srityse

Medicina ir sveikata

Medicinos užklausos tradiciškai kelia iššūkį LLM dėl tikslumo poreikio. „GPT-5“ įvertina ne mažiau kaip 80% mažesnį haliucinacijos procentą „Healthbench“, dažnai pralenkdami ne tik GPT-4, bet ir beveik visus šiuo metu prieinamus konkurencinius modelius. Nepriklausomi recenzentai pažymi, kad GPT-5 yra aktyvi minties partneris, proaktyviai pažymėjęs galimas problemas ir pateikdamas daugiau naudingų atsakymų-ryškų pagerėjimą, palyginti su GPT-4 kartais spekuliacinėmis santraukomis.

kodavimas ir techninės užduotys

GPT-5 taip pat drastiškai sumažina haliucinaciją programuojant, sukuria mažiau pagamintų API, neegzistuojančių funkcijų ir nelogiškų kodų fragmentų. Ankstyvieji modeliai buvo žinomi dėl tikėtinų garsų, tačiau neveikiančio kodo; „GPT-5“, pasinaudojęs gilesniu mokymu ir faktų tikrinimu, sukuria tikslesnį, kontekstą suvokiantį kodą ir prieš atsakant jis labiau linkęs pažymėti dviprasmiškus reikalavimus.

Bendrosios žinios ir naujienos

Paskelbus naujausius įvykius ar niuansuotas faktines temas, GPT-5 kryžminiai nuorodos į kelis šaltinius, cituoja informaciją ir dažniau nustato nenuoseklumą ar pasenusį turinį. Pažymėtina, kad labiau sakoma: „Aš nežinau ir nerekomenduoju papildomų tyrimų kraštų atvejais, o ne gamyba.

Apribojimai: nevisiškai be haliucinacijos

Nepaisant visų šių pažangų, GPT-5 nėra apsaugotas nuo haliucinacijų. Kai kurie nepriklausomi etalonai ir vartotojo anekdotai pabrėžia nuolatinius, nors ir retesnes, kraštų scenarijus, sudėtingas samprotavimo grandines ar užduotis be patikimų mokymo duomenų. Vartotojams, neturintiems interneto prieigos prieigos ar domenų, kur tiesa yra labai dviprasmiška, vis dar vyksta neteisingi išėjimai, nors ir žymiai rečiau nei GPT-4.

Santrauka: pagrindiniai haliucinacijos mažinimo veiksniai

Apibendrinant galima pasakyti, kad pagrindiniai veiksniai, lemiantys žymiai GPT-5 haliucinaciją, palyginti su GPT-4, yra:

-Vieninga, ekspertų paremta architektūra: dinamiškai nukreipia klausimus tinkamiausioms posistemiams, kad būtų galima kryžmiškai tikrinti ir apibendrinti faktus.
- Struktūrizuotas „mąstymo“ režimas: teikia pirmenybę lėtai, įrodymais pagrįstai pagrįstiems pagrindams, palyginti su greitosios generavimu.
- Išplėstas modelio kontekstas: sumažina sutrumpintą dreifą ir pagrindinių detalių praradimą.
- Griežtesnis duomenų kuravimas ir RLHF: sandariai filtruojama nepatikima informacija ir griežtai nubausta haliucinuotų ar pernelyg pasitikinčių atsakymų mokymuose.
-Rimta lyginamosios analizės ir grįžtamojo ryšio kilpos: Nuolat streso testai faktualumas ir greitai ištaiso aptiktas problemas po paleidimo
- Automatizuotas patikrinimas ir netikrumo kalibravimas: vidiniai faktų tikrintojai, atsisakymai ir atsisakymai daro modelį saugesnį ir sąžiningesnį apie jo ribas.

Atlikdamas šias pažangas, GPT-5 peržengia naują sintetinio teksto pagrindimo slenkstį, nustatant naują patikimumo standartą AI pagrįsto informacijos gavimo ir žinių darbe įvairiuose, realaus pasaulio scenarijuose.

Kodėl GPT-5 sumažina haliucinacijas, palyginti su GPT-4