Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Milyen speciális adatkészleteket használtak a GPT-4.5 kiképzéséhez


Milyen speciális adatkészleteket használtak a GPT-4.5 kiképzéséhez


A GPT-4.5-et sokféle adatkészletre képzették, beleértve a nyilvánosan elérhető adatok keverékét, az adatpartnerségek védett adatait és a házon belül kifejlesztett egyedi adatkészleteket. Ezek az adatkészletek együttesen hozzájárulnak a modell robusztus beszélgetési képességeihez és a világ tudásához. A rendelkezésre álló információkban azonban nem említik kifejezetten a használt adatkészletek konkrét részleteit.

A képzési folyamat új felügyeleti technikákat tartalmazott, a hagyományos módszerekkel, például a felügyelt finomhangolással (SFT) és az emberi visszacsatolásból származó megerősítés tanulásával (RLHF), hasonlóan a GPT-4O-hoz [1] [3]. A modell fejlesztése tartalmazza a skálázható igazítási technikákat is, ahol a kisebb modellek kiváló minőségű képzési adatokat generálnak a nagyobb modellekhez, javítva a modell irányíthatóságát és az árnyalat megértését [7].

Az OpenAI adatfeldolgozó csővezetéke szigorú szűrést tartalmaz az adatok minőségének fenntartása és a lehetséges kockázatok enyhítése érdekében. Fejlett adatszűrési folyamatokat alkalmaznak a személyes adatok feldolgozásának csökkentése érdekében a modellek kiképzésekor. Ezenkívül moderációs API -k és biztonsági osztályozók kombinációját használják a káros vagy érzékeny tartalom használatának megakadályozására [1].

Noha a pontos adatkészletek nem részletesek, a megközelítés egy széles és változatos adat-alapot hangsúlyoz, hogy támogassa a GPT-4.5 képességeit olyan feladatokban, mint például az írás, a programozás és a gyakorlati problémák megoldása kevesebb hallucinációval [1] [3].

Idézetek:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4-rings-the-the-thable-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-bout-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-how-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1