Deepseek đạt được độ chính xác cao trên điểm chuẩn AIME 2024 với các kỹ thuật sáng tạo

DeepSeek đã sử dụng những kỹ thuật cụ thể nào để đạt được độ chính xác cao trên điểm chuẩn AIME 2024

Deepseek đạt được độ chính xác cao trên điểm chuẩn AIME 2024 bằng cách sử dụng một số kỹ thuật sáng tạo:

1. Tạo dữ liệu đào tạo tập trung: DeepSeek Dữ liệu đào tạo tạo ra có thể tự động được xác minh, đặc biệt là trong các lĩnh vực như toán học nơi tính đúng đắn không rõ ràng. Cách tiếp cận này cho phép họ tập trung vào việc tạo ra dữ liệu chất lượng cao, có liên quan đóng góp trực tiếp vào việc cải thiện hiệu suất mô hình [1].

2. Các chức năng thưởng hiệu quả: Họ đã phát triển các chức năng phần thưởng hiệu quả cao được thiết kế để xác định các ví dụ đào tạo mới thực sự sẽ cải thiện mô hình. Chiến lược này đã giúp tránh lãng phí tài nguyên tính toán vào dữ liệu dự phòng, đảm bảo rằng mô hình học được từ các ví dụ có giá trị nhất [1].

3. Phép chưng cất và tối ưu hóa mô hình: Deepseek đã sử dụng các kỹ thuật chưng cất mô hình để tạo ra các mô hình nhỏ hơn vẫn đạt được kết quả ấn tượng. Chẳng hạn, mô hình 7B chưng cất của họ đã vượt qua độ chính xác của các mô hình nguồn mở lớn hơn như QWQ-32B-Preview, mặc dù có ít tham số hơn. Điều này cho thấy cách đào tạo tập trung có thể dẫn đến hiệu suất mạnh mẽ trong các lĩnh vực cụ thể với các tài nguyên tính toán khiêm tốn [1].

4. Chuỗi tính toán và lý luận thời gian thử nghiệm: Các mô hình Deepseek, chẳng hạn như Deepseek R1, sử dụng một kỹ thuật gọi là "Tính toán thời gian thử nghiệm", cho phép mô hình dành nhiều thời gian và sức mạnh tính toán hơn cho mỗi vấn đề. Cách tiếp cận này bắt chước sự cân nhắc giống con người, dẫn đến các phản ứng chính xác và chu đáo hơn. Khi mô hình tạo ra các chuỗi lý luận dài hơn, nó có thể giải quyết các vấn đề ngày càng phức tạp với độ chính xác cao hơn [6].

5. Tính minh bạch và kiến trúc đa tác nhân: Các mô hình Deepseek, đặc biệt là DeepSeek-R1, sử dụng một kiến trúc hợp tác đa tác nhân, tích hợp các con đường lý luận đa dạng. Synergy này giúp giảm thiểu các thành kiến dành riêng cho nhiệm vụ và tăng cường tính nhất quán bằng cách giảm sự biến đổi. Cách tiếp cận có cấu trúc cho phép mô hình ưu tiên động các giải pháp có độ tin cậy cao trong khi lặp đi lặp lại ít đầu ra nhất định [3].

Các kỹ thuật này cùng nhau đóng góp vào hiệu suất ấn tượng của Deepseek trên điểm chuẩn AIME 2024, cho thấy cách các phương pháp đào tạo chiến lược và thiết kế mô hình có thể vượt trội so với sức mạnh tính toán thô để đạt được độ chính xác cao.

Trích dẫn:
[1] https://www.geekwire.com/2025/deepseeks-new-model-s
.
[3] https://arxiv.org/html/2503.10573v1
[4] https://www.prompthub.us/blog/deepseek-r-1-model-overview-and-how-it-ranks-against-openais-o1
[5] https://aws.amazon.com/bedrock/deepseek
[6] https://smythos.com/ai-agents/agent-architectures/deepseek-r1/
[7] https://www.amitysolutions.com/blog/deepseek-r1-ai-giant-from-china
[8] https://cloudsecurityalliance.org/blog/2025/01/29/deepseek-rewriting-the-rules-of-ai-development
[9] https://www.inferless.com/learn/the-ultimate-guide-to-deepseek-models