Personalizarea modelelor DeepSeek-R1 implică mai multe componente de costuri, în special atunci când le implementați pe platforme precum Amazon Web Services (AWS). Iată o defalcare detaliată a costurilor asociate personalizării și implementării modelelor DeepSeek-R1:
1. Costuri de instruire: Costul inițial de instruire al DeepSeek-R1 este semnificativ mai mic în comparație cu alte modele precum ChatGPT O1. Deepseek-R1 este estimat să coste între 6 milioane de dolari pentru a se antrena, ceea ce este cu 16x la 33x mai ieftin decât chatgpt O1 [3]. Cu toate acestea, acest cost este pentru dezvoltarea inițială și formarea modelului, nu pentru personalizare.
2. Personalizare și implementare pe AWS: Când personalizați modelele DeepSeek-R1 folosind funcția de import personalizată a modelului Amazon Bedrock, există mai multe costuri de luat în considerare:
- Costuri de inferență: Acestea se bazează pe numărul de copii ale modelului activ și pe durata lor de activitate. Prețul pe unitatea de model personalizat (CMU) variază în funcție de factori precum arhitectura și regiunea. De exemplu, prețul pe CMU pe minut este de 0,0785 USD [4].
- Costuri de stocare: există un cost lunar de stocare pe CMU, care este de 1,95 USD [4]. Numărul de CMU -uri necesare depinde de arhitectura modelului și de lungimea contextului.
3. Exemplu Calculul costurilor: Pentru un model DeepSeek-R1-Distill-Lama-8B care necesită 2 CMU, dacă modelul este activ timp de 1 oră pe zi, costul de inferență zilnic ar fi de aproximativ 9,42 USD. Peste o lună, acest lucru totalizează până la 282,60 dolari pentru inferență și 3,90 USD pentru depozitare, ceea ce duce la un cost lunar total estimat de 286,50 USD [4].
4. Prețuri la cerere pentru modele Deepseek: Pe AWS, prețurile la cerere pentru modele Deepseek precum Deepseek R-1 este de 0,00135 USD la 1.000 de jetoane de intrare și 0,0054 USD la 1.000 de jetoane de ieșire [8]. Acest model de prețuri este util pentru aplicațiile care necesită o utilizare flexibilă fără angajamente pe termen lung.
În rezumat, personalizarea modelelor DeepSeek-R1 implică costuri legate de implementarea modelului și utilizarea pe platforme precum AWS, cu taxe specifice pentru inferență și stocare bazată pe unități de model personalizate. Costul inițial de instruire al modelului este semnificativ mai mic decât modelele comparabile, ceea ce îl face o opțiune eficientă din punct de vedere al costurilor pentru aplicațiile AI.
Citări:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-r1-distille-lama-models-with-amazon-bedrock-custom-model-import
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-a-cost-eficient-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/