Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon 인간 협업을 개선하기 위해 GPT-4.5에서 사용되는 새로운 정렬 기술


인간 협업을 개선하기 위해 GPT-4.5에서 사용되는 새로운 정렬 기술


GPT-4.5는 인간의 필요와 의도에 대한 모델의 이해를 향상시켜 인간 협업을 향상 시키도록 설계된 새롭고 확장 가능한 정렬 기술을 통합합니다. 이러한 기술은 소규모 모델에서 파생 된 데이터를 사용하여 더 크고 강력한 모델을 훈련시킬 수 있으며, 이는 AI 모델이 점점 더 복잡해지고 더 넓은 문제를 해결함에 따라 중요합니다 [1] [3] [7].

키 개선

1. 조향성 : 새로운 정렬 기술은 GPT-4.5의 조향성을 향상시켜 사용자가 원하는 결과를보다 효과적으로 안내 할 수있게합니다. 이것은 모델의 응답을 정확하게 제어 해야하는 작업에 특히 중요합니다 [1] [3].

2. 뉘앙스 이해 : GPT-4.5는 뉘앙스에 대한 이해를 더 잘 보여줍니다. 이는 인간 의사 소통의 복잡하고 미묘한 측면을보다 효과적으로 처리 할 수 ​​있습니다. 이 개선은 공감과 감성 지능이 필요한 작업에 필수적이다 [1] [3].

3. 자연 대화 : 자연스러운 대화에 참여하는 모델의 능력이 크게 향상되었습니다. 이제는 더 직관적이고 공감 적으로 반응 할 수 있으며, 상호 작용을보다 인간적으로 느끼게합니다. 이는 고객 서비스, 상담 및 협업 창의적 프로젝트와 같은 응용 프로그램에 유리합니다 [1] [3] [7].

훈련 과정

GPT-4.5는 GPT-4O에 사용 된 것과 유사한 감독 된 미세 조정 (SFT) 및 인간 피드백 (RLHF)과 같은 전통적인 방법의 조합을 사용하여 개발되었습니다. 이 모델은 공개적으로 이용 가능한 데이터, 파트너십의 독점 데이터 및 사내에서 개발 된 사용자 정의 데이터 세트를 포함하여 다양한 데이터 세트에서 미리 훈련 및 교육을 받았습니다. 이 다양한 훈련 데이터는 강력한 대화 능력과 광범위한 세계 지식에 기여합니다 [1] [3].

감정 지능

이 모델은 향상된 감성 지능을 보여 주어 사회적 신호에 적절하게 감지하고 반응 할 수 있습니다. 이것은 상호 작용을보다 자연스럽고 공감하게 만듭니다. 이는 미묘한 의사 소통이 필요한 응용 분야에 특히 유익합니다 [7].

전반적으로 GPT-4.5의 새로운 정렬 기술은 인간 의도 및 요구에 더 잘 맞을 수있는보다 협력적이고 직관적 인 AI 도구를 만들어 광범위한 응용 프로그램에 적합합니다.

인용 :
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqajgqcpmgehkoee6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-paper-conference.pdf
[7] https://topmestads.com/openai-release-gpt-4-5/
[8] https://arxiv.org/html/2408.06837v1