当在AWS或Azure上使用DeepSeek-R1时,组织应意识到几种隐藏的成本和考虑因素:
AWS上的隐藏成本
1。基础架构成本:虽然DeepSeek-R1本身并未产生直接模型使用费,但用户为消耗的计算资源付费。 AWS为AI优化的云服务器收取每小时124美元的费用,连续使用的云服务器每月可能每月近90,000美元[1] [2]。这一成本要比通过API访问型号的费用要高得多,例如Meta的Llama 3.1,该模型的价格为每100万个代币3美元[1]。
2。存储成本:对于使用Amazon Bedrock自定义模型导入部署的型号,每个自定义型号单元的每月存储成本。例如,如果像DeepSeek-R1-Distill-lalama-8b这样的模型需要两个CMU,则每月存储成本约为3.90美元[6]。
3。推断成本:自定义模型的推断成本也根据用法模式而变化。例如,如果DeepSeek-R1-Distill-Lalama-8b型号每天活跃一小时,则估计的每月推理成本可能约为282.60美元[6]。
Azure的隐藏成本
1。变量定价:Microsoft Azure客户不需要DeepSeek-R1的专用服务器,但他们仍然为基础计算能力付费。这导致定价可变,这取决于模型的运行效率[1] [2]。截至2025年初,据报道,DeepSeek-R1在Azure上使用是免费的,但要受到速率限制,这可能会改变[3]。
2。缺乏明确的定价文档:由于DeepSeek-R1尚未与Azure的定价计算器完全集成,因此用户必须与销售或支持团队联系以获取详细的定价信息[3]。缺乏透明性会使预算计划具有挑战性。
3.合规性和安全性注意事项:虽然不是直接成本,但在云平台上部署诸如DeepSeek-R1之类的AI模型需要仔细考虑合规性和安全性。例如,在具有不同数据隐私法的地区使用云服务可以增加与确保合规性相关的复杂性和潜在成本[5]。
##一般隐藏成本
1。数据隐私和安全问题:如果组织选择通过其母公司的API使用DeepSeek-R1,该API的价格为每百万个代币2.19美元,则必须考虑数据隐私和安全风险。通过中国服务器进行路由工作负载可能会对本地法规进行敏感数据,这可能需要采取其他合规措施[1] [2]。
2。培训和部署成本:虽然DeepSeek报告了R1模型的培训成本相对较低,但实际支出可能包括对基础设施,数据获取和人员的大量投资,这些投资尚未完全披露[8]。这可能会影响长期运营成本和效率评估。
总而言之,虽然DeepSeek-R1在处理方面提供了成本效率,但在AWS或Azure上使用它的总成本包括基础设施租赁费,潜在的存储成本和基于使用效率的可变定价。此外,合规性和安全考虑可以增加复杂性和潜在费用。
引用:
[1] https://campustechnology.com/articles/2025/02/04/aws-microsoft-google-toshoth-others-make-make-make-deepseek-deepseek-r1-ai-model-model-available-available-on-their-platforms.aspx
[2] https://campustechnology.com/articles/2025/02/04/aws-microsoft-google-toshoth-therse-make-make-make-deepseek-deepseek-r1-ai-model-model-available-on-their-their-platforms.aspx?admgarea=news
[3] https://learn.microsoft.com/en-us/answers/questions/2152620/price-for-usage-of-deepseek-r1
[4] https://prompt.16x.engineer/blog/deepseek-r1-cost-pricing-speed
[5] https://www.findai.app/comparative-analysis-of-deepseek-model-deployment-costs-costs-across-cloud-platforms/
[6] https://repost.aws/questions/QU-hcixrtFSaSoKH8GL-KogA/pricing-model-of-deepseek-r1-distilled-llama-models-with-amazon-bedrock-custom-model-import
[7] https://www.byteplus.com/en/topic/408956
[8] https://www.n-ix.com/deepseek-explaind/