La personnalisation des modèles Deepseek-R1 implique plusieurs composants de coûts, en particulier lors de leur déploiement sur des plateformes comme Amazon Web Services (AWS). Voici une ventilation détaillée des coûts associés à la personnalisation et au déploiement des modèles Deepseek-R1:
1. Coûts de formation: Le coût de formation initial de Deepseek-R1 est nettement inférieur à d'autres modèles comme Chatgpt O1. Deepseek-R1 devrait coûter entre 6 millions de dollars pour s'entraîner, ce qui est de 16x à 33x moins cher que Chatgpt O1 [3]. Cependant, ce coût concerne le développement initial et la formation du modèle, et non pour la personnalisation.
2. Personnalisation et déploiement sur AWS: Lors de la personnalisation des modèles Deepseek-R1 à l'aide de la fonction d'importation de modèle personnalisée d'Amazon, il y a plusieurs coûts à considérer:
- Coûts d'inférence: ceux-ci sont basés sur le nombre de copies de modèles actifs et leur durée d'activité. Le prix par unité de modèle personnalisé (CMU) varie en fonction des facteurs tels que l'architecture et la région. Par exemple, le prix par CMU par minute est de 0,0785 $ [4].
- Coûts de stockage: il y a un coût de stockage mensuel par CMU, soit 1,95 $ [4]. Le nombre de CMU requis dépend de l'architecture et de la longueur du contexte du modèle.
3. Plus d'un mois, cela totalise 282,60 $ pour l'inférence et 3,90 $ pour le stockage, ce qui a entraîné un coût mensuel estimé total de 286,50 $ [4].
4. Prix à la demande pour les modèles Deepseek: Sur AWS, le prix à la demande pour les modèles Deepseek comme Deepseek R-1 est de 0,00135 $ pour 1 000 jetons d'entrée et 0,0054 $ pour 1 000 jetons de sortie [8]. Ce modèle de tarification est utile pour les applications qui nécessitent une utilisation flexible sans engagements à long terme.
En résumé, la personnalisation des modèles Deepseek-R1 implique des coûts liés au déploiement du modèle et à l'utilisation sur des plates-formes telles que AWS, avec des frais spécifiques pour l'inférence et le stockage basés sur des unités de modèle personnalisées. Le coût de formation initial du modèle est nettement inférieur aux modèles comparables, ce qui en fait une option rentable pour les applications d'IA.
Citations:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-componison/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-ofeepseek-r1-distilla-llama-models-with-amazon-bedrock-custom-model-iMport
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-eepseek-r1-a-cost-efficient-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distrillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/