Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Milyen forgatókönyvekben mélyítik meg a CHATGPT-t a nulla lövés tanulásban


Milyen forgatókönyvekben mélyítik meg a CHATGPT-t a nulla lövés tanulásban


A DeepSeek kiemelkedő teljesítményt mutat be a CHATGPT-nél nulla lövésű tanulási forgatókönyvekben, meghatározott körülmények között. Itt vannak a legfontosabb területek, ahol a DeepSeek kiemelkedik:

A továbbfejlesztett érvelési képességek

A DeepSeek modellek, különösen a DeepSeek R-1 és R-1-Zero, az érvelési feladatok jelentős javulását mutatták a CHATGPT-hez képest. Az olyan referenciaértékekben, mint az AIME és a GPQA, a DeepSeek R-1-Zero felülmúlta az Openai O1 modelljét, elérve a Pass@1 pontosságot 71,0%, ami tovább növelhető a többségi szavazási technikákkal 86,7% -ra [1] [2]. Ez azt jelzi, hogy a DeepSeek különösen ügyes a logikai érvelést igénylő feladatoknál előzetes példák nélkül.

A domain-specifikus ismeretek kezelése

A DeepSeek architektúrája speciális modulokat tartalmaz a különféle domainekhez, például a matematikához és a kódoláshoz. Ezek a modulok lehetővé teszik, hogy jobban teljesítsenek műszaki kontextusban a CHATGPT -hez képest, ami általánosabb. Különleges tesztekben a DeepSeek V3 felülmúlta a CHATGPT-t a nulla lövésű tanulási forgatókönyvekben, különösen a matematikai érvelési és programozási feladatokban [3] [4].

Érzékenység a technikák kérésére

Megfigyelték, hogy a DeepSeek modellek jobban teljesítenek a nulla lövéssel, nem pedig néhány lövéssel. Ez ellentétben áll a Chatgpt-vel, ahol néhány lövés kontextus javíthatja a teljesítményt. A DeepSeek ajánlása az, hogy egyértelmű és tömör utasításokat használjon nulla lövés beállításban az optimális eredmények eléréséhez, amely összhangban áll a Microsoft érvelési modellekkel kapcsolatos kutatásainak eredményeivel [1] [2].

Tanulás és adaptáció

A DeepSeek R-1-Zero edzési folyamata lehetővé teszi a kifinomult érvelési magatartás önállóan fejlesztését. Az idő múlásával megtanulja a saját kimeneteinek önjavítását és validálását, ami jobb pontosságot eredményez a komplex érvelési feladatokban [1]. Ez az önfejlesztési képesség figyelemre méltó előnye a nulla lövés forgatókönyvekben, amikor a modellnek széles körű kontextus nélkül válaszokat kell generálni.

Összefoglalva: a DeepSeek felülmúlja a CHATGPT-t a nulla lövés tanulásában, elsősorban a továbbfejlesztett érvelési képességek, a speciális domain tudáskezelés, a hatékony felszólítási technikák és a robusztus önanoválási mechanizmusok miatt. Ezek a tényezők különösen alkalmassá teszik a logikai konzisztenciát és a műszaki pontosságot igénylő feladatokhoz.

Idézetek:
[1] https://www.prompthub.us/blog/deepseek-r--model-overview-and-how-it-tanks-against-openais-o1
[2] https://prompthub.substack.com/p/have-the-chinese-ovaken-openai
[3] https://frontend-snippets.com/blog/deepseek-vs-chatgpt-khich- logge-model-leads-ai
[4] https://aclantology.org/2024.emnlp-main.408.pdf
[5] https://www.youtube.com/watch?v=7hccf8nm8nm
[6] https://news.ycombinator.com/item?id=42823568
[7] https://www.reddit.com/r/localllama/comments/1i9txf3/deepseek_is_way_better_in_python_code_generation/
[8] https://arxiv.org/html/2405.04434v4