Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hvilke spesifikke datasett ble brukt til å trene GPT-4.5


Hvilke spesifikke datasett ble brukt til å trene GPT-4.5


GPT-4.5 ble trent på et mangfoldig sett med datasett, inkludert en blanding av offentlig tilgjengelige data, proprietære data fra datapartnerskap og tilpassede datasett utviklet internt. Disse datasettene bidrar kollektivt til modellens robuste samtaleegenskaper og verdens kunnskap. Spesifikke detaljer om de eksakte datasettene som brukes er imidlertid ikke eksplisitt nevnt i tilgjengelig informasjon.

Treningsprosessen involverte nye tilsynsteknikker kombinert med tradisjonelle metoder som overvåket finjustering (SFT) og forsterkningslæring fra menneskelig tilbakemelding (RLHF), lik de som ble brukt for GPT-4O [1] [3]. Modellens utvikling inkluderte også skalerbare justeringsteknikker, der mindre modeller genererer treningsdata av høy kvalitet for større modeller, noe som forbedrer modellens styrbarhet og forståelse av nyanse [7].

Openais databehandlingsrørledning inkluderer streng filtrering for å opprettholde datakvalitet og dempe potensielle risikoer. De bruker avanserte datafiltreringsprosesser for å redusere behandlingen av personlig informasjon når du trener modellene sine. I tillegg bruker de en kombinasjon av deres moderasjons -API og sikkerhetsklassifiserere for å forhindre bruk av skadelig eller sensitivt innhold [1].

Selv om de eksakte datasettene ikke er detaljerte, understreker tilnærmingen et bredt og mangfoldig datatilførsel for å støtte GPT-4.5s evner i oppgaver som skriving, programmering og å løse praktiske problemer med færre hallusinasjoner [1] [3].

Sitasjoner:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4-brings-to-the-ai-table-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/opena-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-dhismodel-is
[8] https://arxiv.org/html/2404.07840v1