GPT-4.5 Podatki o usposabljanju in tehnike nadzora

Kateri posebni nabori so bili uporabljeni za usposabljanje GPT-4.5

GPT-4.5 je bil usposobljen za raznolik nabor naborov podatkov, vključno z mešanico javno dostopnih podatkov, lastniškimi podatki iz podatkovnih partnerstev in nabori po meri, razviti v hiši. Ti nabori podatkov skupaj prispevajo k močnemu pogovornemu zmožnosti in svetovnem znanju modela. Vendar posebne podrobnosti o natančnih uporabljenih naborih niso izrecno omenjene v razpoložljivih informacijah.

Proces usposabljanja je vključeval nove tehnike nadzora v kombinaciji s tradicionalnimi metodami, kot so nadzorovano natančno nastavitev (SFT) in učenje okrepitve iz človeških povratnih informacij (RLHF), podobno kot za GPT-4O [1] [3]. Razvoj modela je vključeval tudi tehnike prilagodljivih poravnav, kjer manjši modeli ustvarjajo kakovostne podatke o usposabljanju za večje modele, kar izboljšuje krmiljenje modela in razumevanje nianse [7].

OpenAI -jev obdelava podatkov vključuje strogo filtriranje za ohranjanje kakovosti podatkov in ublažitev potencialnih tveganj. Uporabljajo napredne procese filtriranja podatkov, da zmanjšajo obdelavo osebnih podatkov pri usposabljanju svojih modelov. Poleg tega uporabljajo kombinacijo svojega zmernega API -ja in varnostnih klasifikatorjev, da preprečijo uporabo škodljive ali občutljive vsebine [1].

Medtem ko natančni nabori podatkov niso podrobno opisani, pristop poudarja široko in raznoliko podatkovno fundacijo za podporo zmogljivosti GPT-4.5 pri nalogah, kot so pisanje, programiranje in reševanje praktičnih težav z manj halucinacijami [1] [3].

Navedbe:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4-brings-to-the-ai-table-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model -is
[8] https://arxiv.org/html/2404.07840V1