GPT-4.5 træningsdata og tilsynsteknikker

Hvilke specifikke datasæt blev brugt til at træne GPT-4.5

GPT-4.5 blev trænet på et forskelligt sæt datasæt, herunder en blanding af offentligt tilgængelige data, proprietære data fra datapartnerskaber og brugerdefinerede datasæt udviklet internt. Disse datasæt bidrager kollektivt til modellens robuste samtaleevne og verdenskendskab. Imidlertid nævnes specifikke detaljer om de nøjagtige datasæt, der er anvendt, ikke eksplicit i de tilgængelige oplysninger.

Uddannelsesprocessen involverede nye tilsynsteknikker kombineret med traditionelle metoder som overvåget finjustering (SFT) og forstærkningslæring fra human feedback (RLHF), svarende til dem, der blev brugt til GPT-4O [1] [3]. Modelens udvikling omfattede også skalerbare justeringsteknikker, hvor mindre modeller genererer træningsdata af høj kvalitet til større modeller, hvilket forbedrer modellens styrbarhed og forståelse af nuance [7].

Openais databehandlingsrørledning inkluderer streng filtrering for at opretholde datakvalitet og mindske potentielle risici. De anvender avancerede datafiltreringsprocesser for at reducere behandlingen af personlige oplysninger, når de træner deres modeller. Derudover bruger de en kombination af deres moderations -API og sikkerhedsklassifikatorer for at forhindre brugen af skadeligt eller følsomt indhold [1].

Mens de nøjagtige datasæt ikke er detaljeret, understreger fremgangsmåden et bredt og forskelligartet datafundament til understøttelse af GPT-4.5s kapaciteter i opgaver såsom skrivning, programmering og løsning af praktiske problemer med færre hallucinationer [1] [3].

Citater:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
)
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-relseases-trpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-trpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-hers-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1