Scoperta dei costi di personalizzazione e distribuzione di modelli DeepSeek-R1 su AWS

Qual è il costo per personalizzare i modelli DeepSeek-R1

La personalizzazione dei modelli DeepSeek-R1 prevede diversi componenti di costo, in particolare quando li distribuisce su piattaforme come Amazon Web Services (AWS). Ecco una ripartizione dettagliata dei costi associati alla personalizzazione e alla distribuzione di modelli DeepSeek-R1:

1. Costi di formazione: il costo di formazione iniziale di DeepSeek-R1 è significativamente inferiore rispetto ad altri modelli come Chatgpt O1. Si stima che DeepSeek-R1 costi tra $ 6 milioni per l'allenamento, che è da 16x a 33x più economico di GATGPT O1 [3]. Tuttavia, questo costo è per lo sviluppo iniziale e la formazione del modello, non per la personalizzazione.

2. Personalizzazione e distribuzione su AWS: quando si personalizzano i modelli DeepSeek-R1 utilizzando la funzione di importazione del modello personalizzata di Amazon Bedrock, ci sono diversi costi da considerare:
- Costi di inferenza: questi si basano sul numero di copie del modello attivo e sulla loro durata dell'attività. Il prezzo per unità modello personalizzata (CMU) varia a seconda di fattori come l'architettura e la regione. Ad esempio, il prezzo per CMU al minuto è di $ 0,0785 [4].
- Costi di archiviazione: esiste un costo di archiviazione mensile per CMU, che è $ 1,95 [4]. Il numero di CMU richiesti dipende dall'architettura del modello e dalla lunghezza del contesto.

3. Esempio Calcolo dei costi: per un modello DeepSeek-R1-Distill-Lllama-8B che richiede 2 CMU, se il modello è attivo per 1 ora al giorno, il costo di inferenza giornaliero sarebbe di circa $ 9,42. Oltre un mese, questo è totali a $ 282,60 per l'inferenza e $ 3,90 per lo stoccaggio, con un costo mensile totale stimato di $ 286,50 [4].

4. Prezzi su richiesta per i modelli DeepSeek: su AWS, i prezzi su richiesta per i modelli DeepSeek come DeepSeek R-1 sono $ 0,00135 per 1.000 token di input e $ 0,0054 per 1.000 token di uscita [8]. Questo modello di prezzo è utile per applicazioni che richiedono un utilizzo flessibile senza impegni a lungo termine.

In sintesi, la personalizzazione dei modelli DeepSeek-R1 prevede i costi relativi alla distribuzione e all'utilizzo dei modelli su piattaforme come AWS, con addebiti specifici per l'inferenza e l'archiviazione basate su unità di modello personalizzate. Il costo di formazione iniziale del modello è significativamente inferiore ai modelli comparabili, rendendolo un'opzione economica per le applicazioni AI.

Citazioni:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestuios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-distilled-llama-models-with-amazon-bedrock-custom-model-import
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the--power-ofdeepseek-r1-a-cost-efficient-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/