Repartição de custos de personalização e implantação de modelos Deepseek-R1 na AWS

A personalização dos modelos Deepseek-R1 envolve vários componentes de custo, principalmente ao implantá-los em plataformas como a Amazon Web Services (AWS). Aqui está um detalhamento detalhado dos custos associados à personalização e implantação de modelos Deepseek-R1:

1. Custos de treinamento: O custo de treinamento inicial do Deepseek-R1 é significativamente menor em comparação com outros modelos como o ChatGPT O1. Estima-se que o Deepseek-R1 custe entre US $ 6 milhões para treinar, o que é de 16x a 33x mais barato que o ChatGPT O1 [3]. No entanto, esse custo é para o desenvolvimento e treinamento inicial do modelo, não para personalização.

2. Personalização e implantação na AWS: Ao personalizar os modelos Deepseek-R1 usando o recurso de importação de modelo personalizado da Amazon Bedrock, há vários custos a serem considerados:
- Custos de inferência: são baseados no número de cópias de modelo ativo e na duração da atividade. O preço por unidade modelo personalizada (CMU) varia dependendo de fatores como arquitetura e região. Por exemplo, o preço por CMU por minuto é de US $ 0,0785 [4].
- Custos de armazenamento: há um custo mensal de armazenamento por CMU, que é de US $ 1,95 [4]. O número de CMUs necessário depende da arquitetura e da duração do contexto do modelo.

3. Cálculo de custos de exemplo: para um modelo Deepseek-R1-Distill-LLama-8B que requer 2 cmus, se o modelo estiver ativo por 1 hora por dia, o custo de inferência diária seria de aproximadamente US $ 9,42. Durante um mês, isso totaliza US $ 282,60 para inferência e US $ 3,90 para armazenamento, resultando em um custo mensal total estimado de US $ 286,50 [4].

4. Preços sob demanda para modelos Deepseek: Na AWS, o preço sob demanda para modelos Deepseek como Deepseek R-1 é de US $ 0,00135 por 1.000 tokens de entrada e US $ 0,0054 por 1.000 tokens de saída [8]. Este modelo de preços é útil para aplicações que requerem uso flexível sem compromissos de longo prazo.

Em resumo, a personalização dos modelos Deepseek-R1 envolve custos relacionados à implantação e uso de modelos em plataformas como a AWS, com cobranças específicas de inferência e armazenamento com base em unidades de modelo personalizado. O custo de treinamento inicial do modelo é significativamente menor que os modelos comparáveis, tornando-o uma opção econômica para aplicativos de IA.

Citações:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/quhcixrtfsaskh8gl-koga/pricing-model-ofdeepseek-r1-distilled-lama-models-with-mazon-bedrock-custom-model-odel
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-ofdeek-r1-a-cost-eficiente-ai-model/post/165557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distilation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/

Qual é o custo de personalizar modelos Deepseek-R1