Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Những kỹ thuật căn chỉnh mới được sử dụng trong GPT-4.5 để cải thiện sự hợp tác của con người


Những kỹ thuật căn chỉnh mới được sử dụng trong GPT-4.5 để cải thiện sự hợp tác của con người


GPT-4.5 kết hợp các kỹ thuật căn chỉnh mới, có thể mở rộng được thiết kế để tăng cường sự hợp tác của con người bằng cách cải thiện sự hiểu biết của mô hình về nhu cầu và ý định của con người. Các kỹ thuật này cho phép đào tạo các mô hình lớn hơn và mạnh mẽ hơn sử dụng dữ liệu có nguồn gốc từ các mô hình nhỏ hơn, điều này rất quan trọng khi các mô hình AI ngày càng phức tạp và giải quyết các vấn đề rộng hơn [1] [3] [7].

Cải tiến chính

1. Khả năng lái xe: Các kỹ thuật căn chỉnh mới tăng cường khả năng lái của GPT-4.5, cho phép người dùng hướng dẫn mô hình hiệu quả hơn đối với kết quả mong muốn. Điều này đặc biệt quan trọng đối với các nhiệm vụ yêu cầu kiểm soát chính xác các phản hồi của mô hình [1] [3].

2. Hiểu về sắc thái: GPT-4.5 thể hiện sự hiểu biết tốt hơn về sắc thái, cho phép nó xử lý các khía cạnh phức tạp và tinh tế của giao tiếp con người hiệu quả hơn. Sự cải thiện này là rất quan trọng đối với các nhiệm vụ đòi hỏi sự đồng cảm và trí tuệ cảm xúc [1] [3].

3. Cuộc trò chuyện tự nhiên: Khả năng tham gia vào cuộc trò chuyện tự nhiên của mô hình đã được cải thiện đáng kể. Bây giờ nó có thể đáp ứng trực quan và đồng cảm hơn, làm cho các tương tác cảm thấy giống con người hơn. Điều này có lợi cho các ứng dụng như dịch vụ khách hàng, tư vấn và các dự án sáng tạo hợp tác [1] [3] [7].

Quá trình đào tạo

GPT-4.5 đã được phát triển bằng cách sử dụng kết hợp các phương pháp truyền thống như tinh chỉnh được giám sát (SFT) và học củng cố từ phản hồi của con người (RLHF), tương tự như các phương pháp được sử dụng cho GPT-4O. Mô hình được đào tạo trước và được đào tạo sau các bộ dữ liệu khác nhau, bao gồm dữ liệu có sẵn công khai, dữ liệu độc quyền từ quan hệ đối tác và bộ dữ liệu tùy chỉnh được phát triển trong nhà. Dữ liệu đào tạo đa dạng này góp phần vào khả năng đàm thoại mạnh mẽ và kiến ​​thức thế giới rộng lớn [1] [3].

Trí tuệ cảm xúc

Mô hình thể hiện trí tuệ cảm xúc nâng cao, cho phép nó phát hiện và phản ứng thích hợp với các tín hiệu xã hội. Điều này làm cho các tương tác tự nhiên và đồng cảm hơn, đặc biệt có lợi cho các ứng dụng yêu cầu giao tiếp sắc thái [7].

Nhìn chung, các kỹ thuật căn chỉnh mới trong GPT-4.5 nhằm mục đích tạo ra một công cụ AI hợp tác và trực quan hơn, có thể phù hợp hơn với ý định và nhu cầu của con người, làm cho nó phù hợp cho một loạt các ứng dụng.

Trích dẫn:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://arxiv.org/html/2502.13775v1
[3] https://www.lesswrong.com/posts/fqAJGqcPmgEHKoEE6/openai-releases-chatgpt-4-5
[4] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-structure/1025132
[5] https://www.lesswrong.com/posts/fqAJGqcPmgEHKoEE6/openai-releases-gpt-4-5
[6] https://proceedings.neurips.cc/paper_files/paper/2024/file/a51a74b2d71387dc71cc29181b5519bb-Paper-Conference.pdf
[7] https://topesto
[8] https://arxiv.org/html/2408.06837v1