„Deepseek VS GPT-4“: našumas, efektyvumas ir išlaidų palyginimas su humanevalu

Kaip „Deepseek“ pasirodymas humanevaluose lyginamas su GPT-4

„Deepseek“ pasirodymas „Humaneval“ etalone rodo pastebimą pranašumą prieš GPT-4. Tiksliau, „Deepseek“ pasiekė 73,78% „Humaneval“ leidimo normą, kuris įvertintas kodavimo galimybes, o GPT-4 surinko apie 67% panašių vertinimų [1] [2]. Tai rodo, kad „Deepseek“ yra veiksmingesnis kengiant ir sprendžiant kodavimo problemas, palyginti su GPT-4.

Kalbant apie efektyvumą, „Deepseek“ naudoja ekspertų mišinio (MOE) architektūrą, kuri suaktyvina tik 37 milijardus jo 671 milijardo parametrų užduotims, leisdama jai išlaikyti aukštą našumą, kai žymiai mažesnės skaičiavimo išlaidos yra 214,3 karto pigiau nei GPT. -4 TOKENO PRIEMONĖS [1] [2]. Šis efektyvumas reiškia greitesnes ir tikslesnes kodo generavimo ir derinimo galimybes, todėl „Deepseee“ tampa įtikinamu pasirinkimu kūrėjams.

Be to, „Deepseek“ konteksto langas yra žymiai didesnis esant 128K žetonams, palyginti su „GPT-4“ maksimaliu 8K žetonu, suteikdamas galimybę apdoroti plačiau įėjimus [1] [2]. Ši funkcija gali būti ypač naudinga atliekant sudėtingas kodavimo užduotis, kurioms reikia didesnio konteksto.

Apskritai, „Deepseek“ ne tik pranoksta GPT-4, kalbant apie kodavimo našumą „Humaneval“, bet ir siūlo didelę sąnaudų ir efektyvumo naudą, pozicionuodamas save kaip stiprią alternatyvą didelių kalbos modelių kraštovaizdyje.

Citatos:
[1] https://daily.dev/blog/deepseek-everything-you-reed-to-know-out-about-this-new-llm-in-one-place
[2] https://docsbot.ai/models/compare/gpt-4/deepseek-v3
[3] https://www.reddit.com/r/chatgptcoding/comments/1fdrhbx/new_deepseekv25_model_scores_89_on_humaneval/
[4] https://aclanthology.org/2024.findings-acl.471.pdf
[5] https://deepseekcoder.github.io
[6] https://news.ycombinator.com/item?id=41999151
[7] https://www.deepseek.com
[8] https://www.reddit.com/r/localllama/comments/1hr56e3/notes_on_deepseek_v3_is_it_try_better_than/