GPT-4.5: Fremskritt i AI-justering, styrbarhet og emosjonell intelligens

Hvilke nye justeringsteknikker brukes i GPT-4.5 for å forbedre menneskets samarbeid

GPT-4.5 inkluderer nye, skalerbare justeringsteknikker designet for å forbedre menneskelig samarbeid ved å forbedre modellens forståelse av menneskelige behov og intensjoner. Disse teknikkene tillater trening av større og kraftigere modeller ved bruk av data avledet fra mindre modeller, noe som er avgjørende ettersom AI -modeller blir stadig mer kompliserte og løser bredere problemer [1] [3] [7].

Nøkkelforbedringer

1. Styrbarhet: De nye justeringsteknikkene forbedrer GPT-4.5s styrbarhet, slik at brukere kan veilede modellen mer effektivt mot ønskede utfall. Dette er spesielt viktig for oppgaver som krever presis kontroll over modellens svar [1] [3].

2. Forståelse av nyanse: GPT-4.5 viser en bedre forståelse av nyanse, slik at den kan håndtere komplekse og subtile aspekter ved menneskelig kommunikasjon mer effektivt. Denne forbedringen er viktig for oppgaver som krever empati og emosjonell intelligens [1] [3].

3. Naturlig samtale: Modellens evne til å delta i naturlig samtale er blitt betydelig forbedret. Det kan nå svare mer intuitivt og empatisk, noe som får interaksjoner til å føles mer menneskelignende. Dette er gunstig for applikasjoner som kundeservice, rådgivning og kreative prosjekter [1] [3] [7].

Treningsprosess

GPT-4.5 ble utviklet ved bruk av en kombinasjon av tradisjonelle metoder som overvåket finjustering (SFT) og forsterkningslæring fra menneskelig tilbakemelding (RLHF), lik de som ble brukt for GPT-4O. Modellen var forhåndsutdannet og post-trent på forskjellige datasett, inkludert offentlig tilgjengelige data, proprietære data fra partnerskap og tilpassede datasett utviklet internt. Denne mangfoldige treningsdata bidrar til dens robuste samtaleegenskaper og bred verdenskunnskap [1] [3].

Følelsesmessig intelligens

Modellen viser forbedret emosjonell intelligens, slik at den kan oppdage og svare riktig på sosiale signaler. Dette gjør interaksjoner mer naturlige og empatiske, noe som er spesielt gunstig for applikasjoner som krever nyansert kommunikasjon [7].

Totalt sett har de nye justeringsteknikkene i GPT-4.5 som mål å lage et mer samarbeidsvillig og intuitivt AI-verktøy som bedre kan samsvare med menneskelig intensjon og behov, noe som gjør det egnet for et bredt spekter av applikasjoner.

Sitasjoner:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topmostads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1