GPT-4.5 был обучен разнообразным наборам наборов данных, включая сочетание общедоступных данных, проприетарных данных из партнерских отношений с данными и пользовательских наборов данных, разработанных на месте. Эти наборы данных в совокупности способствуют надежным разговорным возможностям модели и мировым знаниям. Тем не менее, конкретные подробности об использованных наборах данных не упоминаются в доступной информации.
Процесс обучения включал новые методы надзора в сочетании с традиционными методами, такими как контролируемая тонкая настройка (SFT) и подкрепление, обучение от обратной связи человека (RLHF), аналогичные тем, которые используются для GPT-4O [1] [3]. Разработка модели также включала в себя масштабируемые методы выравнивания, где более мелкие модели генерируют высококачественные учебные данные для более крупных моделей, повышая управляемость модели и понимание нюанса [7].
Конвейер обработки данных OpenAI включает в себя строгую фильтрацию для поддержания качества данных и снижения потенциальных рисков. Они используют расширенные процессы фильтрации данных, чтобы уменьшить обработку личной информации при обучении своих моделей. Кроме того, они используют комбинацию своих API модерации и классификаторов безопасности для предотвращения использования вредного или чувствительного контента [1].
Хотя точные наборы данных не подробны, подход подчеркивает широкую и разнообразную основу данных для поддержки возможностей GPT-4.5 в таких задачах, как написание, программирование и решение практических проблем с меньшим количеством галлюцинаций [1] [3].
Цитаты:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4-brings-to-the-ai-table-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-heres-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1