DeepSeek vs GPT-4：性能，效率和成本比较

与GPT-4相比，DeepSeek在Humaneval上的表现如何

DeepSeek在HumaneVal基准测试中的表现比GPT-4具有明显的优势。具体而言，DeepSeek在人类事件上达到了73.78％的通行率，该通行率评估了编码能力，而GPT-4在类似评估中得分约为67％[1] [2]。这表明与GPT-4相比，DeepSeek在产生和解决编码问题方面更有效。

在效率方面，DeepSeek利用了专家的混合（MOE）体系结构，该架构仅激活其6710亿个任务参数中的370亿个，从而使其能够保持高性能，据报道，计算成本显着降低了214.3倍，比GPT便宜214.3倍-4用于令牌处理[1] [2]。这种效率转化为更快，更精确的代码生成和调试功能，使DeepSeek成为开发人员的引人注目的选择。

此外，与GPT-4的最大8K令牌相比，DeepSeek的上下文窗口在128K令牌时的上下文窗口大大较大，从而使其能够在处理过程中处理更广泛的输入[1] [2]。此功能对于需要更大上下文的复杂编码任务尤其有利。

总体而言，DeepSeek不仅超过了GPT-4在人道主义的编码性能方面，而且还提供了巨大的成本和效率优势，可以将自己定位为大型语言模型景观中的强大选择。

引用：
[1] https://daily.dev/blog/deepseek-everything-you-need-to-new-about-this-new-llm-in-in-In-in-in-in-in-in-phoce
[2] https://docsbot.ai/models/compare/gpt-4/deepseek-v3
[3] https://www.reddit.com/r/chatgptcoding/comments/1fdrhbx/new_deepseekv25_model_scores_scores_89_on_humaneval/
[4] https://aclanthology.org/2024.findings-acl.471.pdf
[5] https://deepseekcoder.github.io
[6] https://news.ycombinator.com/item?id=41999151
[7] https://www.deepseek.com
[8] https://www.reddit.com/r/localllama/comments/1hr56e3/notes_on_deepseek_v3_is_it_it_it_truly_better_better_than/