GPT-5가 환각을 줄이는 방법 : 건축 혁신과 훈련 발전

GPT-5는 GPT-4에 비해 환각을 크게 줄여서 다양한 벤치 마크, 도메인 및 실제 시나리오에서 사실 정확도와 신뢰성의 주요 개선을 보여줍니다. 이러한 감소는 단일 수정의 결과가 아니라 오히려 건축 혁신, 개선 된 교육 방법론, 고급 평가 프로토콜 및 향상된 안전 시스템의 시너지 효과입니다. 다음은 GPT-5에 대한 환각 경향이 감소한 경향이있는 메커니즘과 원리에 대한 포괄적 인 검사입니다.

llms에서 환각의 정의

대형 언어 모델 (LLMS)은 때때로 환각을 생성 할 수 있습니다. **는 사실상 부정확하거나 기본 데이터에 근거하지 않은 설득력 있고 유창한 진술을 생성 할 수 있습니다. 환각에는 제작 된 사실, 부정확 한 속성 및 잘못된 논리가 포함됩니다. GPT-5의 개선은 이러한 문제를 직접 목표로하여 개방형 추론과 사실적인 질문 응답 모두에서 측정 할 수있게됩니다.

정량적 벤치 마크 비교

GPT-4와 직접 비교하는 것을 GPT-4와 직접 비교하면 환각율의 현저한 감소가 나타납니다.
-GPT-5는 Longfact 및 FactScore와 같은 사실 벤치 마크에서 GPT-4의 4.5 5.1%에 비해 환각율이 0.7 1.0%로 낮습니다.
-의료 정확도를 평가하는 Healthbench는 GPT-5의 환각율이 2%미만으로 GPT-4O의 12%보다 훨씬 낮습니다.
-일반 사용자 쿼리 (실제 시나리오)에 대한 분석에 따르면 GPT-5의 오류율은 4.8%, GPT-4O의 경우 20% 이상을 발견했습니다.
-여러 독립 소스는 GPT-4O에 비해 사실 오류가 45 인치 감소한 것을 확인하여 근거와 자기 교정의 도약을 강조합니다.

도메인 간의 이러한 일관된 이익은 근본적인 변화를 강조합니다. GPT-5의 설계 및 훈련은 사전 환각의 원천을 체계적으로 목표로합니다.

건축 혁신

사려 깊은 입력 라우팅 및 통일

GPT-5는 전문 전문가 하위 시스템 또는 헤드로 프롬프트를 동적으로 경로로 경로로 경로를 소개합니다. 이는 GPT-4의 모 놀리 식 디자인보다 훨씬 더 미세한 세분화로 목표로하는 추론과 사실을 확인할 수 있습니다. GPT-5는 적절한 모듈간에 복잡한 사용자 요청을 지능적으로 분할함으로써 컨텐츠를 교차 검토하고 여러 소스를 집계하며 지원되지 않거나 제조되지 않은 사실의 전파를 최소화 할 수 있습니다. 이 라우팅 시스템은 GPT-5의 미묘한, 복잡하거나 새로운 사실 작업에 대한 우수한 처리를 뒷받침합니다.

향상된 Â 사고 모드

GPT-5의 중요한 기능은 명백한 사고 모드로, 모델이 외부 답변을 생성하기 전에 내부적으로 의도적으로, 증거를 수집하며 정보를 구성하도록 지시합니다. 벤치 마크에서, 사고가 빠르고 구조화되지 않은 모드보다 일관되게 낮을 때 GPT-5의 환각율은 (자유 형식 생성과 반대로) 모델링 구조적 추론이보다 신뢰할 수있는 출력을 생성 함을 나타냅니다. 사용자와 연구원들은 GPT-5 "사고 모드가 GPT-4O의 가장 빠른 세대 설정보다 환각 될 가능성이 6 배 적다는 것을 관찰합니다.

모델 깊이 및 컨텍스트 창

GPT-5는 컨텍스트 창과 모델 깊이를 확장하여 더 많은 정보를 참조하고 긴 출력에 대한 일관성을 유지할 수 있습니다. 이것은 더 많은 사실을 염두에두고, 드리프트를 줄이고, 플롯을 잃을 가능성이 줄어든다는 것을 의미합니다. 이는 입력 길이가 창지 제한에 접근하거나 초과 할 때 종종 이전 모델에서 환각을 유발합니다.

교육 데이터 및 방법 향상

고품질 데이터 선택 및 필터링

OpenAI 및 관련 연구자들은 사전 훈련 및 미세 조정 단계에서 GPT-5에 대한 데이터 큐 레이션을 개선했습니다. 여기에는 다음이 포함됩니다.
- 신뢰할 수없는 웹 소스, 구식 정보 및 고유 한 오류 또는 가상의 컨텐츠를 제공하는 합성 데이터의 엄격한 제외.
- 사실 분야 (과학, 의학, 법률)에 중점을 둔 선별 된 데이터 세트의 적극적인 포함.
- 참조, 인용 및 추적성에 대한보다 공격적인 필터링, 지원되지 않는 일반화를 낙담시킵니다.

이러한 신중한 데이터 선택은 GPT-5가 초기 학습 중에 소음이 적고 오해의 소지가 적은 패턴에 노출되어 환각 행동의 각인을 줄임한다는 것을 의미합니다.

고급 강화 학습 및 인간 피드백 (RLHF)

GPT-5는 인간 피드백 (RLHF)의 강화 학습을 더 크고 더 세분화 된 규모로 활용합니다. 인간의 평가자는 일반적인 도움을 위해 출력을 평가할뿐만 아니라, 특히 환각 된 사실, 지원되지 않는 청구 및 과잉 오류를 태그하고 벌금을 부과합니다. 이후 단계에서 도메인 전문가는 라벨링 (특히 건강이나 과학과 같은 고분비 도메인)에 기여하여 크라우드를 즐겁게하는 산문뿐만 아니라 모델을 엄격한 교정에 노출시킵니다.

또한 강화 학습은 이제 다목적입니다.
- 사실적인 정확성
- 전염병 불확실성의 적절한 표현 (Â 모르겠다”
- 소스 속성 및 추적 성

다중 인용 연구에 따르면 GPT-5는 GPT-4보다 모호한 상황에서 환각을 거부하는 대신 외부 소스를 확인하기위한 면책 조항이나 프롬프트를 선택합니다.

지속적인 업데이트 및 온라인 학습

GPT-4가 한 번 훈련을받은 경우, GPT-5는 지속적인 학습의 요소를 통합합니다 ** 새로운 신뢰할 수있는 정보의 정기적 인 업데이트와 사용자 및 데이터 파트너가 표시하는 것으로 알려진 오류의 활성 수정. 이 온라인 학습 루프는 문제가되는 패턴이 오래 지속되지 않음을 의미하며, 새로운 과목 (훈련 후 이벤트, 새로운 기술)에서 환각이 훨씬 더 드물다는 것을 의미합니다.

강력한 평가 프로토콜

확장 및 스트레스 테스트 사실 벤치 마크

Openai는 GPT-5에 대한 더 넓고 깊은 평가 세트에 투자하여 사실도 영역에서보다 도전적이고 미묘한 및 개방형 프롬프트로 강조했습니다.
- 짧은 사실뿐만 아니라 연장 된 추론 및 상황 유지 보수를 다루는 Longfact, Factscore 및 Healthbenchâ.
-Simple QA ** Â 웹 연결 및 오프라인 모드에서 모델을 테스트하여 고립 된 교육에서 약점을 드러냅니다.
- 실제 프롬프트는 학업 시험 질문뿐만 아니라 생산 chatgpt 트래픽을 반영합니다.

이러한 다양한 테스트를 통해 OpenAI는 GPT-4가 추측 또는 과도한 일반화가 발생하기 쉬운 Edge Case Â를 정확히 지적하고 GPT-5를 강제로 재교육하거나 조정하여 이러한 경향을 무시할 수 있습니다.

배치 후 모니터링 및 수정

생산 원격 측정 및 사용자 피드백 덕분에 OpenAI는 모델 배포 직후 환각 사고를 감지하고 해결할 수 있습니다. 이 빠른 반복은 사용자 경험과 모델 신뢰성 사이의 피드백 루프를 닫아서 오해에 대한 수정 또는 전례없는 속도로 지속적인 오류를 적용합니다.

안전, 불확실성 및 거부 메커니즘

전염병 불확실성 교정

GPT-5의 우수한 신뢰성의 한 가지 특징은 불확실성을 표현하고 자체 청구를받을 수있는 능력입니다. GPT-5는 자신감이 있지만 지원되지 않는 답변 (환각)을 생성하는 대신 다음에 교육을 받고 조정됩니다.
- 현재의 검증 가능한 지식에 대한 접근이 부족한 경우 인정하십시오.
- 사용자가 1 차 또는 권위있는 출처에 상담하도록 권장합니다.
- 모호하거나 논란의 여지가 있거나 논쟁의 여지가있는 청구를 식별하고 강조합니다.

이 자기 교체는 이전 모델에서 약점이었습니다. GPT-5는 아키텍처와 훈련 목표에 명시적인 불확실성 모델링을 구축함으로써 자체 한계에 대한 정직한 전임자를 능가합니다.

자동 사실 확인

GPT-5는 알려진 데이터베이스에 대한 검증을 위해 또는 실시간 웹 소스에 대한 검증을 위해 모델 생성 출력이 확률 론적으로 플래그를 지정하는 내부 사실 확인 계층을 통합합니다. 사실을 확인할 수없는 경우, 출력이 억제되고, 경고로 다시 작성되거나, 사용자가 외부 리소스를 확인하도록 프롬프트합니다. 이 자동화 된 메커니즘은 최종 출력으로 전달되는`환각 된 진술의 가능성을 급격히 줄입니다.

안전 인식 출력 필터링

GPT-4 및 이전 모델이 때때로 그럴듯하지만 위험한 정보 (예 : 건강 또는 법률 쿼리)를 반환 한 경우, GPT-5는 고위험 주제에 대한 고급 필터링을 구현합니다. 향상된 안전 계층은 높은 충격적인 답변을 교차 확인하고, 환각을 억제하며, 사용자 지분이 높을 때 투기 콘텐츠를 거부합니다. 이로 인해 GPT-5는 일반적인 대화뿐만 아니라 진지한 전문적인 사용을 위해 더 안전합니다.

도메인 전체의 실제 증거

약과 건강

의료 쿼리는 정밀도의 필요성으로 인해 전통적으로 LLM에 어려움을 겪고 있습니다. GPT-5는 HealthBench에서 환각율을 80% 이상 낮게, 종종 GPT-4뿐만 아니라 현재 이용 가능한 거의 모든 경쟁 모델을 능가합니다. 독립적 인 검토 자들은 GPT-5가 적극적인 사고 파트너이며, 잠재적 인 우려를 사전에 표시하고 더 유용한 답변을 제공하고 GPT-4의 때때로 투기 적 요약보다 현저한 개선을 제공한다고 지적합니다.

코딩 및 기술 작업

GPT-5는 또한 프로그래밍의 환각을 크게 줄여서 제작 된 API, 존재하지 않는 함수 및 비논리적 코드 스 니펫을 더 적게 생성합니다. 초기 모델은 그럴듯한 소리를 냈지만 수술 적 코드로 유명했습니다. 더 깊은 교육 및 사실 확인을 활용하는 GPT-5는보다 정확한 상황 인식 코드를 생성하며 응답하기 전에 모호한 요구 사항을 플래그 할 가능성이 높습니다.

일반 지식 및 뉴스

최근 이벤트 또는 미묘한 사실 주제를 제기 할 때 GPT-5는 여러 출처를 상호 참조하고 정보를 인용하며 불일치 또는 구식 컨텐츠를 더 자주 식별합니다. 특히, 제작하기보다는 Edge Case에서 추가 연구를 권장하거나 추가 연구를 권장 할 가능성이 더 높습니다.

한계 : 완전히 환각이 없음

이러한 모든 발전에도 불구하고 GPT-5는 환각에 면역되지 않습니다. 일부 독립적 인 벤치 마크와 사용자 일화는 끊임없는 교육 데이터가없는 에지 시나리오, 복잡한 추론 체인 또는 작업의 오류가 드물지만 지속적으로 강조합니다. 웹에 연결된 액세스가없는 사용자 또는 진실이 매우 모호한 도메인에있는 경우, 잘못된 출력은 여전히 발생하지만 GPT-4보다 자주 덜 자주 발생합니다.

요약 : 환각 감소의 핵심 동인

결론적으로, GPT-5의 환각 감소를 담당하는 주요 요인은 다음과 같습니다.

-통합, 전문가 중심의 아키텍처 : 사실의 교차 체크 및 집계를위한 가장 적절한 하위 시스템으로 질문을 동적으로 선보입니다.
- 구조화 된 '사고'모드 : 빠른 세대에 대한 느린 증거 기반 추론 우선 순위.
- 확장 된 모델 컨텍스트 : 잘림 제조 드리프트 및 주요 세부 사항 손실을 최소화합니다.
- 엄격한 데이터 큐 레이션 및 RLHF : 신뢰할 수없는 정보를 단단히 걸러 내고 훈련에서 환각 또는 과도한 답변을 가혹하게 처벌합니다.
-심각한 벤치마킹 및 피드백 루프 : 지속적으로 스트레스 테스트 사실과 빠르게 감지 된 문제를 빠르게 수정합니다.
- 자동 검증 및 불확실성 교정 : 내부 사실 검사기, 면책 조항 및 거부는 모델을 한계에 대해 더 안전하고 정직하게 만듭니다.

이러한 발전으로 GPT-5는 합성 텍스트 근거의 새로운 임계 값을 넘어서서 다양한 실제 시나리오에서 AI 중심 정보 검색 및 지식 작업의 신뢰성에 대한 새로운 표준을 설정합니다.

GPT-5가 GPT-4에 비해 환각을 줄이는 이유