GPT-4.5 проходив навчання на різноманітному наборі наборів даних, включаючи поєднання загальнодоступних даних, власних даних від партнерств даних та спеціальних наборів даних, розроблених власним. Ці набори даних колективно сприяють надійним розмовним можливостям моделі та світовим знанням. Однак конкретні деталі про точні набори даних, що використовуються, прямо не згадуються у наявній інформації.
Навчальний процес включав нові методи нагляду в поєднанні з традиційними методами, такими як нагляд за тонкою настройкою (SFT) та підкріпленням з зворотного зв'язку з людьми (RLHF), подібно до тих, що використовуються для GPT-4O [1] [3]. Розробка моделі також включала методи масштабованої вирівнювання, де менші моделі генерують високоякісні дані про тренування для більших моделей, підвищуючи керуючість моделі та розуміння нюансів [7].
Трубопровід обробки даних OpenAI включає сувору фільтрацію для підтримки якості даних та пом'якшення потенційних ризиків. Вони використовують розширені процеси фільтрації даних, щоб зменшити обробку особистої інформації під час навчання своїх моделей. Крім того, вони використовують комбінацію своїх поміркованих API та класифікаторів безпеки для запобігання використанню шкідливого або чутливого вмісту [1].
Незважаючи на те, що точні набори даних не детально описані, підхід наголошує на широкому та різноманітному основі даних для підтримки можливостей GPT-4.5 у таких завданнях, як написання, програмування та вирішення практичних проблем з меншою кількістю галюцинацій [1] [3].
Цитати:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4-brings-to-the-table-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-here-heres-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1