GPT-4.5 교육 데이터 및 감독 기술

GPT-4.5를 훈련시키는 데 사용 된 특정 데이터 세트

GPT-4.5는 공개적으로 이용 가능한 데이터, 데이터 파트너십의 독점 데이터 및 사내에서 개발 된 사용자 정의 데이터 세트를 포함하여 다양한 데이터 세트 세트에 대해 교육을 받았습니다. 이 데이터 세트는 모델의 강력한 대화 기능과 세계 지식에 총체적으로 기여합니다. 그러나 사용 된 정확한 데이터 세트에 대한 특정 세부 사항은 사용 가능한 정보에 명시 적으로 언급되지 않았습니다.

훈련 과정에는 GPT-4O에 사용 된 것과 유사한 감독 미세 조정 (SFT) 및 인간 피드백 (RLHF)과 같은 전통적인 방법과 결합 된 새로운 감독 기술이 포함되었습니다 [1] [3]. 이 모델의 개발에는 소규모 모델이 더 큰 모델에 대한 고품질 교육 데이터를 생성하여 모델의 조향성과 뉘앙스 이해를 향상시키는 확장 가능한 정렬 기술도 포함되었습니다 [7].

OpenAI의 데이터 처리 파이프 라인에는 데이터 품질을 유지하고 잠재적 위험을 완화하기위한 엄격한 필터링이 포함되어 있습니다. 그들은 고급 데이터 필터링 프로세스를 사용하여 모델을 훈련시 개인 정보의 처리를 줄입니다. 또한, 그들은 중재 API와 안전 분류기의 조합을 사용하여 유해하거나 민감한 컨텐츠의 사용을 방지합니다 [1].

정확한 데이터 세트는 상세하지 않지만, 접근 방식은 더 적은 환각으로 실제 문제를 해결하고, 프로그래밍하고, 실제 문제를 해결하는 것과 같은 작업에서 GPT-4.5의 기능을 지원하기위한 광범위하고 다양한 데이터 기반을 강조합니다 [1] [3].

인용 :
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://towardsdatascience.com/what-gpt-4------------ 타이블-74e392a32ac3/
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[4] https://www.chatbase.co/blog/gpt-5
[5] https://www.wired.com/story/openai-gpt-45/
[6] https://www.datacamp.com/blog/everything-we-know-about-gpt-5
[7] https://www.vellum.ai/blog/gpt-4-5-is-heres-how-good-this-model-is
[8] https://arxiv.org/html/2404.07840v1