Ao usar o Deepseek-R1 na AWS ou no Azure, existem vários custos e considerações ocultas que as organizações devem estar cientes de:
custos ocultos na AWS
1. Custos de infraestrutura: Embora o próprio DeepSeek-R1 não incorra em taxas de uso direto de modelo, os usuários pagam pelos recursos de computação consumidos. A AWS cobra até US $ 124 por hora por um servidor em nuvem otimizado da AI, o que pode chegar a quase US $ 90.000 por mês para uso contínuo [1] [2]. Esse custo é significativamente maior do que o acesso a modelos via APIs, como o Llama 3.1 da Meta, que custa US $ 3 por 1 milhão de tokens [1].
2. Custos de armazenamento: Para os modelos implantados usando a importação de modelos personalizados da Amazon Bedrock, há um custo mensal de armazenamento por unidade de modelo personalizado. Por exemplo, se um modelo como DeepSeek-R1-Distill-llama-8b exigir duas CMUs, o custo mensal de armazenamento seria de aproximadamente US $ 3,90 [6].
3. Custos de inferência: o custo da inferência de execução em modelos personalizados também varia com base nos padrões de uso. Por exemplo, se um modelo Deepseek-R1-Distill-Llama-8B estiver ativo por uma hora por dia, o custo estimado da inferência mensal poderá ser de cerca de US $ 282,60 [6].
Custos ocultos no Azure
1. Preços variáveis: os clientes do Microsoft Azure não precisam de servidores dedicados para o DeepSeek-R1, mas ainda pagam pelo poder de computação subjacente. Isso leva a preços variáveis, dependendo da eficiência do modelo [1] [2]. No início de 2025, o uso do Deepseek-R1 no Azure foi relatado como livre, mas sujeito a limites de taxa, o que pode mudar [3].
2. Falta de documentação de preços claros: Como o Deepseek-R1 ainda não está totalmente integrado às calculadoras de preços do Azure, os usuários devem entrar em contato com a equipe de vendas ou suporte para obter informações detalhadas sobre preços [3]. Essa falta de transparência pode tornar o planejamento orçamentário desafiador.
3. Considerações de conformidade e segurança: Embora não seja um custo direto, a implantação de modelos de IA como Deepseek-R1 em plataformas em nuvem requer uma consideração cuidadosa de conformidade e segurança. Por exemplo, o uso de serviços em nuvem em regiões com diferentes leis de privacidade de dados pode adicionar complexidade e custos potenciais relacionados à garantia da conformidade [5].
custos ocultos gerais
1. Preocupações de privacidade e segurança de dados: se as organizações optarem por usar o DeepSeek-R1 por meio da API da empresa controladora, que é mais barata em US $ 2,19 por milhão de tokens, eles devem considerar os riscos de privacidade e segurança de dados. As cargas de trabalho de roteamento por meio de servidores chineses podem sujeitar dados sensíveis a regulamentos locais, potencialmente exigindo medidas adicionais de conformidade [1] [2].
2. Custos de treinamento e implantação: Embora os custos de treinamento relatados pela Deepseek para o modelo R1 sejam relativamente baixos, as despesas reais provavelmente incluem investimentos significativos em infraestrutura, aquisição de dados e pessoal, que não são totalmente divulgados [8]. Isso pode afetar os custos operacionais de longo prazo e as avaliações de eficiência.
Em resumo, embora o DeepSeek-R1 ofereça eficiência de custos no processamento, o custo geral de usá-lo na AWS ou Azure inclui taxas de aluguel de infraestrutura, custos potenciais de armazenamento e preços variáveis com base na eficiência do uso. Além disso, considerações de conformidade e segurança podem adicionar complexidade e possíveis despesas.
Citações:
[1] https://campustechnology.com/articles/2025/02/04/aws-microsoft-google-others-make-deepseek-r1-ai-model-avilable on-their-platforms.aspx
[2] https://campustechnology.com/articles/2025/02/04/aws-microsoft-google-others-make-deepseek-r1-ai-model-avilable on their-plataforms.aspx?admgarea=news
[3] https://learn.microsoft.com/en-us/answers/questions/2152620/price-for-usage-of-deepseek-r1
[4] https://prompt.16x.engineer/blog/deepseek-r1-cost-precing-speed
[5] https://www.findai.app/comparative-analysis-of-deepseek-model-deployment-costs-across-cloud-platform/
[6] https://repost.aws/questions/quhcixrtfsaskh8gl-koga/pricing-model-ofdeepseek-r1-distille-lama-models-with-amazon-bedrock-custom-model-odel
[7] https://www.byteplus.com/en/topic/408956
[8] https://www.n-ix.com/deepseek-expling/