GPT-4.5 innehåller nya, skalbara justeringstekniker utformade för att förbättra mänskligt samarbete genom att förbättra modellens förståelse för mänskliga behov och avsikt. Dessa tekniker möjliggör utbildning av större och kraftfullare modeller med hjälp av data härrörande från mindre modeller, vilket är avgörande när AI -modeller blir allt mer komplexa och löser bredare problem [1] [3] [7].
Nyckelförbättringar
1. Steerbility: De nya justeringsteknikerna förbättrar GPT-4,5: s styrbarhet, vilket gör att användare kan vägleda modellen mer effektivt mot önskade resultat. Detta är särskilt viktigt för uppgifter som kräver exakt kontroll över modellens svar [1] [3].
2. Förståelse av nyans: GPT-4.5 visar en bättre förståelse för nyans, vilket gör att den kan hantera komplexa och subtila aspekter av mänsklig kommunikation mer effektivt. Denna förbättring är avgörande för uppgifter som kräver empati och emotionell intelligens [1] [3].
3. Naturlig konversation: Modellens förmåga att engagera sig i naturlig konversation har förbättrats avsevärt. Det kan nu svara mer intuitivt och empatiskt, vilket gör att interaktioner känns mer mänskliga. Detta är fördelaktigt för applikationer som kundservice, rådgivning och kreativa projekt för samarbete [1] [3] [7].
Träningsprocess
GPT-4,5 utvecklades med hjälp av en kombination av traditionella metoder som övervakad finjustering (SFT) och förstärkningslärande från mänsklig feedback (RLHF), liknande de som används för GPT-4O. Modellen var förutbildad och eftertränad på olika datasätt, inklusive offentligt tillgängliga data, proprietära data från partnerskap och anpassade datasätt utvecklade internt. Denna olika utbildningsdata bidrar till dess robusta konversationsfunktioner och bred världskunskap [1] [3].
Emotionell intelligens
Modellen uppvisar förbättrad känslomässig intelligens, vilket gör att den kan upptäcka och svara på lämpligt sätt på sociala ledtrådar. Detta gör interaktioner mer naturliga och empatiska, vilket är särskilt fördelaktigt för applikationer som kräver nyanserad kommunikation [7].
Sammantaget syftar de nya justeringsteknikerna i GPT-4.5 till att skapa ett mer samarbetsvilligt och intuitivt AI-verktyg som bättre kan anpassa sig till mänsklig avsikt och behov, vilket gör det lämpligt för ett brett utbud av applikationer.
Citeringar:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
]
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
]
[7] https://topmostads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1