GPT-4.5: Fremskridt i AI-justering, styrbarhed og følelsesmæssig intelligens

Hvilke nye tilpasningsteknikker bruges i GPT-4.5 til at forbedre menneskets samarbejde

GPT-4.5 indeholder nye, skalerbare justeringsteknikker designet til at forbedre menneskeligt samarbejde ved at forbedre modellens forståelse af menneskelige behov og intention. Disse teknikker giver mulighed for uddannelse af større og mere kraftfulde modeller ved hjælp af data, der stammer fra mindre modeller, hvilket er afgørende, når AI -modeller bliver stadig mere komplekse og løser bredere problemer [1] [3] [7].

Nøgleforbedringer

1. Styrbarhed: De nye justeringsteknikker forbedrer GPT-4.5's styrbarhed, hvilket gør det muligt for brugerne at guide modellen mere effektivt mod ønskede resultater. Dette er især vigtigt for opgaver, der kræver præcis kontrol over modellens svar [1] [3].

2. Forståelse af nuance: GPT-4.5 viser en bedre forståelse af nuance, hvilket gør det muligt for den at håndtere komplekse og subtile aspekter af menneskelig kommunikation mere effektivt. Denne forbedring er afgørende for opgaver, der kræver empati og følelsesmæssig intelligens [1] [3].

3. Naturlig samtale: Modellens evne til at deltage i naturlig samtale er blevet forbedret markant. Det kan nu reagere mere intuitivt og empatisk, hvilket får interaktioner til at føle sig mere menneskelige. Dette er fordelagtigt for applikationer såsom kundeservice, rådgivning og samarbejdsvillige kreative projekter [1] [3] [7].

Træningsproces

GPT-4.5 blev udviklet under anvendelse af en kombination af traditionelle metoder som overvåget finjustering (SFT) og forstærkningslæring fra human feedback (RLHF), svarende til dem, der blev brugt til GPT-4O. Modellen var foruddannet og efteruddannet på forskellige datasæt, herunder offentligt tilgængelige data, proprietære data fra partnerskaber og brugerdefinerede datasæt udviklet internt. Denne forskellige træningsdata bidrager til dens robuste samtaleevne og bred verdensviden [1] [3].

Emotionel intelligens

Modellen udviser forbedret følelsesmæssig intelligens, hvilket giver den mulighed for at opdage og reagere passende på sociale signaler. Dette gør interaktioner mere naturlige og empatiske, hvilket er især fordelagtigt for applikationer, der kræver nuanceret kommunikation [7].

Generelt sigter de nye justeringsteknikker i GPT-4.5 mod at skabe et mere samarbejdsvilligt og intuitivt AI-værktøj, der bedre kan tilpasse sig menneskelig intention og behov, hvilket gør det velegnet til en lang række applikationer.

Citater:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-mprove-trpt-4-api-output-længde-and-struktur/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-relseases-trpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topmostads.com/openai-release-trpt-4-5/
[8] https://arxiv.org/html/2408.06837v1