DeepSeek demonštruje vynikajúci výkon oproti Chatgpt v scenároch učenia s nulovým výletom za konkrétnych podmienok. Tu sú kľúčové oblasti, kde Deepseek vyniká:
Vylepšené schopnosti uvažovania
Modely DeepSeek, najmä Deepseek R-1 a R-1-Zero, preukázali významné zlepšenia úloh uvažovania v porovnaní s Chatgpt. V referenčných hodnotách ako AIME a GPQA, Deepseek R-1-Zero prekonal model O1 On Model OpenAI, ktorý dosiahol presnosť priechodu@1 71,0%, čo možno ďalej zvýšiť na 86,7% pomocou techník väčšiny hlasovania [1] [2]. To naznačuje, že DeepSeek je obzvlášť adept pri úlohách, ktoré si vyžadujú logické zdôvodnenie bez predchádzajúcich príkladov.manipulácia s doménou špecifickými vedomosťami
Architektúra spoločnosti Deepseek obsahuje špecializované moduly pre rôzne domény, ako je matematika a kódovanie. Tieto moduly mu umožňujú lepšie fungovať v technických kontextoch v porovnaní s Chatgpt, ktorý je zovšeobecnený. V konkrétnych testoch spoločnosť Deepseek V3 prekonala chatgpt v scenároch učenia s nulovým výletom, najmä v matematických uvažovacích a programovacích úlohách [3] [4].Citlivosť k technikám výzvy
Bolo pozorované, že modely DeepSeek sú lepšie s nulovým výziev, a nie len málo výskytu. To je v kontraste s Chatgpt, kde málo kontextov môže zvýšiť výkon. Odporúčanie pre DeepSeek je použiť jasné a stručné pokyny v nastavení nulového výstrelu pre optimálne výsledky, ktoré sú v súlade so zisteniami z výskumu spoločnosti Microsoft o modeloch zdôvodňovania [1] [2].Učenie a adaptácia
Výcvikový proces Deepseek R-1-Zero mu umožňuje autonómne rozvíjať sofistikované zdôvodnené správanie. Postupom času sa učí samostatne a overiť svoje vlastné výstupy, čo vedie k zlepšenej presnosti v zložitých uvažovacích úlohách [1]. Táto schopnosť sebapočítania je pozoruhodnou výhodou v scenároch s nulovým záberom, kde model musí generovať reakcie bez rozsiahleho predchádzajúceho kontextu.Stručne povedané, Deepseek prekonáva chatgpt v nulovom výučbe primárne kvôli jeho vylepšeným schopnostiam zdôvodňovania, špecializovaným manipulácii s vedomostiami domén, efektívnymi technikami výzvy a robustných mechanizmov samoliečenia. Tieto faktory sú obzvlášť vhodné pre úlohy, ktoré si vyžadujú logickú konzistentnosť a technickú presnosť.
Citácie:[1] https://www.prompthub.us/blog/deepseek-r-1-model-model-wow-and-how-it----------- ranks-against-openais-o1
[2] https://prompthub.substatack.com/p/have-the-chinese-wentaken-openai
[3] https://frontend-snippets.com/blog/deepseek-vs-chatgpt-hich--Language-model-leads-ai
[4] https://aclanthology.org/2024.emnlp-main.408.pdf
[5] https://www.youtube.com/watch?v=7HCCF8NM8NM
[6] https://news.ycombinator.com/item?id=42823568
[7] https://www.reddit.com/r/localllama/comments/1i9txf3/deepseek_is_way_better_in_python_code_generation/
[8] https://arxiv.org/html/2405.04434v4