Làm thế nào GPT-5 làm giảm ảo giác: Đổi mới kiến trúc và tiến bộ đào tạo

GPT-5 làm giảm đáng kể ảo giác so với GPT-4, thể hiện những cải tiến lớn về độ chính xác và độ tin cậy thực tế giữa các điểm chuẩn, miền và các kịch bản trong thế giới thực. Việc giảm này không phải là kết quả của một sửa đổi duy nhất mà là một sức mạnh tổng hợp của đổi mới kiến trúc, các phương pháp đào tạo được cải thiện, các giao thức đánh giá nâng cao và các hệ thống an toàn nâng cao. Những gì sau đây là một cuộc kiểm tra toàn diện về các cơ chế và nguyên tắc đằng sau xu hướng giảm của ảo giác so với GPT-4.

Định nghĩa ảo giác trong LLMS

Các mô hình ngôn ngữ lớn (LLM) đôi khi có thể tạo ra ảo giác ** Â thuyết phục, thông thạo thông thạo thực tế không chính xác hoặc không có căn cứ trong dữ liệu cơ bản. Ảo giác bao gồm các sự kiện bịa đặt, phân bổ không chính xác và logic không chính xác. Những cải tiến của GPT-5 nhắm trực tiếp vào các vấn đề này, làm cho nó đáng tin cậy hơn trong cả lý luận mở và trả lời câu hỏi thực tế.

So sánh điểm chuẩn định lượng

So sánh trực tiếp GPT-5 với GPT-4 cho thấy giảm tỷ lệ ảo giác:
-Trên các điểm chuẩn thực tế như Longfact và Factscore, GPT-5 thể hiện tỷ lệ ảo giác thấp tới 0,7â0%, so với 4,5%4,5%của GPT-4.
-HealthBench, đánh giá độ chính xác y tế, cho thấy tỷ lệ ảo giác của GPT-5 dưới 2%, thấp hơn nhiều so với 12%của GPT-4O.
-Phân tích về các truy vấn người dùng chung (kịch bản trong thế giới thực) cho thấy tỷ lệ lỗi của GPT-5 giảm xuống 4,8%, so với hơn 20% đối với GPT-4O.
-Nhiều nguồn độc lập xác nhận giảm 45% các lỗi thực tế so với GPT-4O, làm nổi bật bước nhảy vọt về tính nền tảng và tự điều chỉnh.

Những lợi ích nhất quán như vậy trên các lĩnh vực nhấn mạnh một sự thay đổi cơ bản: Thiết kế và đào tạo của GPT-5 là các nguồn nhắm mục tiêu một cách có hệ thống của ảo giác trước đó.

đổi mới kiến trúc

Định tuyến và thống nhất đầu vào chu đáo

GPT-5 giới thiệu một kiến trúc thống nhất, các điều chỉnh động các lời nhắc đến các hệ thống phụ chuyên gia chuyên môn hoặc đầu này. Điều này cho phép lý luận được nhắm mục tiêu và kiểm tra thực tế ở mức độ chi tiết tốt hơn nhiều so với thiết kế nguyên khối của GPT-4. Bằng cách phân tách một cách thông minh các yêu cầu người dùng phức tạp giữa các mô-đun thích hợp, GPT-5 có thể xác định chéo nội dung, tổng hợp nhiều nguồn và giảm thiểu sự lan truyền của các sự kiện không được hỗ trợ hoặc bịa đặt. Hệ thống định tuyến này làm cơ sở cho việc xử lý vượt trội của GPT-5 về các nhiệm vụ thực tế sắc thái, phức tạp hoặc mới lạ.

Tăng cường - Chế độ tư duy

Một tính năng quan trọng trong GPT-5 là chế độ suy nghĩ rõ ràng, hướng dẫn mô hình cân nhắc nội bộ, thu thập bằng chứng và sắp xếp thông tin trước khi đưa ra câu trả lời bên ngoài. Trong các điểm chuẩn, tốc độ ảo giác của GPT-5 khi suy nghĩ luôn thấp hơn so với chế độ nhanh, không cấu trúc chỉ ra rằng mô hình lý luận có cấu trúc (trái ngược với thế hệ tự do) tạo ra các đầu ra đáng tin cậy hơn. Người dùng và nhà nghiên cứu quan sát rằng chế độ GPT-5 Â Â có khả năng bị ảo giác hơn gấp sáu lần so với các cài đặt thế hệ nhanh nhất của GPT-4O.

Cửa sổ độ sâu và bối cảnh mô hình

GPT-5 mở rộng cửa sổ bối cảnh và độ sâu mô hình của nó, cho phép nó tham chiếu thêm thông tin và duy trì sự gắn kết trên các đầu ra dài. Điều này có nghĩa là nó giữ cho nhiều sự thật hơn, tôi giảm sự trôi dạt và làm cho nó ít có khả năng mất cốt truyện, thường kích hoạt ảo giác trong các mô hình trước đó khi độ dài đầu vào tiếp cận hoặc vượt quá giới hạn cửa sổ của chúng.

Cải thiện dữ liệu và phương pháp đào tạo

Lựa chọn và lọc dữ liệu chất lượng cao

OpenAI và các nhà nghiên cứu liên quan đã cải tiến dữ liệu tinh chế cho GPT-5, cả ở giai đoạn đào tạo trước và tinh chỉnh. Điều này liên quan đến:
- Loại trừ chặt chẽ hơn các nguồn web không đáng tin cậy, thông tin lỗi thời và dữ liệu tổng hợp mang lỗi vốn có hoặc nội dung hư cấu.
- Bao gồm tích cực các bộ dữ liệu được quản lý tập trung vào các ngành thực tế (khoa học, y học, luật).
- Lọc mạnh hơn cho các tài liệu tham khảo, trích dẫn và truy xuất nguồn gốc, không khuyến khích khái quát hóa không được hỗ trợ.

Lựa chọn dữ liệu cẩn thận như vậy có nghĩa là GPT-5 được tiếp xúc với ít tiếng ồn hơn và ít mô hình sai lệch hơn trong quá trình học tập ban đầu, làm giảm dấu ấn của hành vi ảo giác.

Học tập củng cố nâng cao và phản hồi của con người (RLHF)

GPT-5 tận dụng việc học củng cố từ phản hồi của con người (RLHF) ở quy mô lớn hơn, chi tiết hơn. Người đánh giá con người không chỉ xếp hạng đầu ra cho sự hữu ích chung, mà đặc biệt gắn thẻ và xử phạt các sự kiện ảo giác, các khiếu nại không được hỗ trợ và các lỗi quá tự tin. Trong các giai đoạn sau, các chuyên gia tên miền đóng góp vào việc dán nhãn (đặc biệt là trong các lĩnh vực cổ phần cao như sức khỏe hoặc khoa học), đưa mô hình để điều chỉnh nghiêm ngặt, không chỉ là văn xuôi làm hài lòng đám đông.

Ngoài ra, học tập củng cố bây giờ là đa mục tiêu:
- Sự đúng đắn thực tế
- Biểu hiện đúng đắn của sự không chắc chắn về epistemia (nói tôi không biết))
- Sự phân bổ nguồn và truy xuất nguồn gốc

Nhiều nghiên cứu được trích dẫn lưu ý rằng GPT-5 từ chối ảo giác trong các tình huống mơ hồ thường xuyên hơn GPT-4, thay vào đó chọn từ chối trách nhiệm hoặc lời nhắc để kiểm tra các nguồn bên ngoài.

Cập nhật và học trực tuyến liên tục

Trong đó GPT-4 phần lớn tĩnh một khi được đào tạo, GPT-5 kết hợp các yếu tố học tập liên tục ** các cập nhật định kỳ từ thông tin mới, đáng tin cậy và điều chỉnh tích cực các lỗi đã biết như được gắn cờ bởi người dùng và các đối tác dữ liệu. Vòng lặp học tập trực tuyến này có nghĩa là các mô hình có vấn đề không tồn tại lâu dài, làm cho ảo giác trong các đối tượng mới hơn (các sự kiện sau đào tạo, công nghệ mới) hiếm hơn nhiều.

Giao thức đánh giá mạnh mẽ

Điểm chuẩn thực tế mở rộng và thử nghiệm căng thẳng

Openai đã đầu tư vào các bộ đánh giá sâu hơn, sâu hơn cho GPT-5, nhấn mạnh nó với các lời nhắc kết thúc đầy thách thức, sắc thái hơn và kết thúc mở trong miền thực tế:
- Longfact, Factscore và Healthbenchâ không chỉ là những thực tế ngắn mà còn kéo dài lý luận và bảo trì bối cảnh.
- QA ** đơn giản- Thử nghiệm mô hình ở cả hai chế độ kết nối web và off ngoại tuyến, phơi bày các điểm yếu trong đào tạo bị cô lập.
- Câu nhắc trong thế giới thực phản ánh lưu lượng Chats sản xuất, không chỉ các câu hỏi kiểm tra học thuật.

Các thử nghiệm đa dạng này cho phép OpenAI xác định các trường hợp cạnh-trong đó GPT-4 sẽ dễ bị đầu cơ hoặc quá mức hóa và buộc phải kiềm chế hoặc điều chỉnh GPT-5 để ghi đè lên các xu hướng đó.

Giám sát và sửa chữa sau triển khai

Nhờ từ xa sản xuất và phản hồi của người dùng, OpenAI có thể phát hiện và giải quyết các sự cố ảo giác ngay sau khi triển khai mô hình. Việc lặp lại nhanh chóng này đóng vòng lặp phản hồi giữa trải nghiệm người dùng và độ tin cậy của mô hình, áp dụng các hiệu chỉnh cho các lỗi sai hoặc các lỗi dai dẳng ở tốc độ chưa từng có.

An toàn, sự không chắc chắn và cơ chế từ chối

Hiệu chỉnh độ không đảm bảo epistemia

Một dấu hiệu của độ tin cậy vượt trội của GPT-5 là khả năng thể hiện sự không chắc chắn và đủ điều kiện yêu cầu của chính nó. Thay vì tạo ra câu trả lời tự tin nhưng không được hỗ trợ (ảo giác), GPT-5 được đào tạo và điều chỉnh để:
- thừa nhận khi nó thiếu quyền truy cập vào kiến thức hiện tại, có thể kiểm chứng.
- Khuyến khích người dùng tham khảo các nguồn chính hoặc có thẩm quyền.
- Xác định và làm nổi bật các khiếu nại mơ hồ, gây tranh cãi hoặc tranh cãi.

Sự tự hiệu chuẩn này là một điểm yếu trong các mô hình trước đây. Bằng cách xây dựng mô hình hóa sự không chắc chắn rõ ràng thành cả mục tiêu kiến trúc và đào tạo, GPT-5 vượt trội so với những người tiền nhiệm trong sự trung thực về những hạn chế của chính nó.

Xác minh thực tế tự động

GPT-5 kết hợp một lớp kiểm tra thực tế nội bộ, trong đó các đầu ra do mô hình tạo ra được gắn cờ xác suất để xác minh chống lại cơ sở dữ liệu đã biết hoặc, khi có sẵn các nguồn web thời gian thực. Nếu sự thật không thể được xác nhận, các đầu ra bị triệt tiêu, viết lại bằng các cảnh báo hoặc nhắc người dùng kiểm tra các tài nguyên bên ngoài. Cơ chế tự động này đã giảm mạnh khả năng của một tuyên bố ảo giác được truyền qua đầu ra cuối cùng.

Lọc đầu ra Afquer-Aware

Trong trường hợp GPT-4 và các mô hình trước đó thỉnh thoảng trả về thông tin hợp lý nhưng rủi ro (ví dụ: trong các truy vấn về sức khỏe hoặc pháp lý), GPT-5 thực hiện lọc nâng cao cho các chủ đề có nguy cơ cao. Các lớp an toàn nâng cao kiểm tra chéo các câu trả lời có tác động cao, ngăn chặn ảo giác có thể xảy ra và từ chối nội dung đầu cơ khi cổ phần của người dùng cao. Điều này làm cho GPT-5 an toàn hơn không chỉ cho các cuộc trò chuyện chung, mà còn cho việc sử dụng chuyên nghiệp nghiêm túc.

Bằng chứng thực tế trên các lĩnh vực

Y học và sức khỏe

Các truy vấn y tế theo truyền thống là thách thức đối với LLM do nhu cầu độ chính xác. GPT-5 điểm ít nhất tỷ lệ ảo giác thấp hơn 80% trên HealthBench, thường vượt trội hơn không chỉ GPT-4 mà gần như tất cả các mô hình cạnh tranh hiện có sẵn. Các nhà đánh giá độc lập lưu ý rằng GPT-5 là một đối tác tư tưởng tích cực, chủ động đánh dấu các mối quan tâm tiềm năng và đưa ra câu trả lời hữu ích hơn-một sự cải thiện rõ rệt so với các bản tóm tắt đầu cơ đôi khi của GPT-4.

Nhiệm vụ mã hóa và kỹ thuật

GPT-5 cũng làm giảm đáng kể ảo giác trong lập trình, tạo ra ít API bịa đặt hơn, các chức năng không tồn tại và các đoạn mã phi logic. Các mô hình ban đầu nổi tiếng với mã âm thanh hợp lý, nhưng không hoạt động; GPT-5, tận dụng đào tạo sâu hơn và kiểm tra thực tế, tạo ra mã nhận biết chính xác hơn, theo ngữ cảnh và có nhiều khả năng gắn cờ các yêu cầu mơ hồ trước khi trả lời.

Kiến thức và tin tức chung

Khi được nhắc về các sự kiện gần đây hoặc các chủ đề thực tế sắc thái, GPT-5 tham chiếu chéo nhiều nguồn, thông tin trích dẫn và thường xác định hơn sự không nhất quán hoặc nội dung lỗi thời. Đáng chú ý, nhiều khả năng nói rằng tôi không biết hoặc đề xuất nghiên cứu bổ sung trong các trường hợp cạnh, thay vì chế tạo.

Hạn chế: Không hoàn toàn không có ảo ảo

Bất chấp tất cả những tiến bộ này, GPT-5 không miễn nhiễm với ảo giác. Một số điểm chuẩn độc lập và giai thoại người dùng làm nổi bật các lỗi liên tục, mặc dù hiếm hơn trong các kịch bản cạnh, chuỗi lý luận phức tạp hoặc các nhiệm vụ mà không có dữ liệu đào tạo đáng tin cậy. Đối với người dùng không có quyền truy cập được kết nối web hoặc trong các tên miền mà sự thật rất mơ hồ, các đầu ra không chính xác vẫn xảy ra, mặc dù ít thường xuyên hơn trong GPT-4.

Tóm tắt: Trình điều khiển cốt lõi của giảm ảo ảo giác

Tóm lại, các yếu tố chính chịu trách nhiệm cho việc giảm đáng kể ảo giác của GPT-5 so với GPT-4 là:

-Kiến trúc thống nhất, dựa trên chuyên gia: Các câu hỏi tự động đến các hệ thống con phù hợp nhất để kiểm tra chéo và tổng hợp các sự kiện.
- Chế độ 'suy nghĩ' có cấu trúc: Ưu tiên lý luận chậm, dựa trên bằng chứng hơn thế hệ nhanh chóng.
- Bối cảnh mô hình mở rộng: Giảm thiểu sự trôi dạt do cắt ngắn và mất các chi tiết chính.
- Curation dữ liệu chặt chẽ hơn và RLHF: Lấy chặt chẽ thông tin không đáng tin cậy và xử phạt gay gắt các câu trả lời ảo giác hoặc quá tự tin trong đào tạo.
-Các vòng chuẩn và phản hồi nghiêm trọng: Tính lý do liên tục kiểm tra thực tế và nhanh chóng khắc phục các vấn đề sau khi ra mắt sau khi ra mắt
- Xác minh tự động và hiệu chuẩn không chắc chắn: kiểm tra thực tế nội bộ, từ chối trách nhiệm và từ chối làm cho mô hình an toàn và trung thực hơn về giới hạn của nó.

Với những tiến bộ này, GPT-5 vượt qua ngưỡng mới trong văn bản tổng hợp, thiết lập một tiêu chuẩn mới về độ tin cậy trong việc truy xuất thông tin điều khiển AI và công việc kiến thức trên các kịch bản thực tế, đa dạng.

Tại sao GPT-5 giảm ảo giác so với GPT-4