Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Jakie konkretne zestawy danych zostały użyte do szkolenia GPT-4.5


Jakie konkretne zestawy danych zostały użyte do szkolenia GPT-4.5


GPT-4.5 został przeszkolony w zakresie różnorodnego zestawu zestawów danych, w tym mieszanki dostępnych publicznie danych, zastrzeżonych danych z partnerstwa danych oraz niestandardowych zestawów danych opracowanych we własnym zakresie. Te zestawy danych łącznie przyczyniają się do solidnych możliwości konwersacyjnych modelu i wiedzy światowej. Jednak szczegółowe szczegóły dotyczące dokładnych użytych zestawów danych nie są wyraźnie wymienione w dostępnych informacjach.

Proces szkoleniowy obejmował nowe techniki nadzoru w połączeniu z tradycyjnymi metodami, takimi jak nadzorowane dostrajanie (SFT) i uczenie się wzmocnienia na podstawie ludzkich informacji zwrotnych (RLHF), podobnie jak w przypadku stosowanych w przypadku GPT-4O [1] [3]. Rozwój modelu obejmował również skalowalne techniki wyrównania, w których mniejsze modele generują wysokiej jakości dane treningowe dla większych modeli, zwiększając sterowalność modelu i zrozumienie niuansów [7].

Rurociąg z przetwarzaniem danych Openai obejmuje rygorystyczne filtrowanie w celu utrzymania jakości danych i złagodzenia potencjalnego ryzyka. Używają zaawansowanych procesów filtrowania danych, aby zmniejszyć przetwarzanie danych osobowych podczas szkolenia swoich modeli. Ponadto używają kombinacji swoich klasyfikatorów moderacji i klasyfikatorów bezpieczeństwa, aby zapobiec użyciu szkodliwej lub czułej zawartości [1].

Chociaż dokładne zestawy danych nie są szczegółowe, podejście podkreśla szeroką i różnorodną podstawę danych do obsługi możliwości GPT-4.5 w zadaniach, takich jak pisanie, programowanie i rozwiązywanie praktycznych problemów z mniejszą liczbą halucynacji [1] [3].

Cytaty:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsDatasciience.com/what-gpt-4-Brings-to-the-ai-table-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-reneases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everinging-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1