GPT-4.5: lle OpenAi kehitti uusia, skaalautuvia kohdistustekniikoita, jotka mahdollistavat suurempien ja tehokkaampien mallien koulutuksen pienemmistä malleista johdettujen tietojen avulla. Nämä tekniikat on suunniteltu parantamaan mallin kykyä ymmärtää ihmisen tarpeita ja aikomusta, mikä parantaa sen ohjattavuutta, vivahteita ja luonnollisia keskusteluominaisuuksia.
Avain kohdistustekniikat
1. Skaalautuva kohdistus: Tämä lähestymistapa sisältää pienempien mallien käyttöä korkealaatuisten mallejen korkealaatuisen harjoitustiedon tuottamiseksi. Tämä menetelmä nopeuttaa harjoitusprosessia ja parantaa mallin kykyä noudattaa vivahteita. Se aiheuttaa kuitenkin myös pienemmissä malleissa esiintyvän vääristymien tai virheiden monistamisen riskin [4] [5].
2. Perinteisten menetelmien yhdistelmä: GPT-4,5 koulutettiin käyttämällä uusien valvontatekniikoiden yhdistelmää sekä perinteisiä menetelmiä, kuten valvottu hienosäätö (SFT) ja vahvistusoppiminen ihmisen palautteesta (RLHF). SFT sisältää oppimisen ihmisen leimattujen esimerkkien perusteella, mikä on tehokasta, mutta voi olla hidasta ja kallista. RLHF sijoittaa ihmisen mieltymyksiin perustuvia lähtöjä, jotka voivat joskus johtaa ylikuormitukseen, mikä tekee AI: stä liian varovaisen tai vähemmän luovan [4] [5] [7].
3. Ihmisten tarpeiden parannettu ymmärtäminen: Uudet kohdistustekniikat keskittyvät mallille opettamiseen paremmin ihmisten tarpeista ja tarkoituksista. Tämä on ratkaisevan tärkeää, koska mallit ratkaisevat monimutkaisempia ongelmia ja ovat vuorovaikutuksessa käyttäjien kanssa vivahteellisemmilla tavoilla [1] [3] [5].
Uusien tekniikoiden vaikutus
GPT-4.5: n uudet kohdistustekniikat ovat johtaneet useisiin parannuksiin:
- Luonnollinen vuorovaikutus: Sisäiset testaajat ilmoittavat, että GPT-4.5 tuntuu luonnollisemmalta ja intuitiivisemmalta, etenkin käsitellessä emotionaalisesti ladattuja kyselyjä. Se voi tarjota neuvoja, hajauttaa turhautumista tai vain kuunnella käyttäjää tarpeen mukaan [1] [3].
- Esteettinen intuitio ja luovuus: Malli osoittaa vahvemman esteettisen intuition ja luovuuden, mikä tekee siitä erityisen hyödyllisen luovan kirjoittamisen ja suunnittelun kaltaisissa tehtävissä [1] [3].
- Alennetut hallusinaatiot: GPT-4,5: llä on vähemmän hallusinaatioita, jotka johtuvat valvomattoman oppimisen edistyksestä, mikä parantaa sen maailmanmallin tarkkuutta ja assosiatiivista ajattelua [5] [6].
Kaiken kaikkiaan näiden tekniikoiden tavoitteena on tehdä GPT-4.5: n reagoivampi, tehokkaampi ja linjattu käyttäjän aikomuksen kanssa, samalla kun se on vastattu joihinkin suurten kielimallien skaalaamiseen liittyviin haasteisiin.
Viittaukset:
[1] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[2] https://arxiv.org/html/2502.11681v2
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
.
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
.
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release
[8] https://pmc.ncbi.nlm.nih.gov/articles/PMC11184879/