Prilagajanje modelov Deepseek-R1 vključuje več komponent stroškov, zlasti pri nameščanju na platformah, kot so Amazon Web Services (AWS). Tu je podrobna razčlenitev stroškov, povezanih s prilagajanjem in uvajanjem modelov Deepseek-R1:
1. Stroški usposabljanja: Začetni stroški usposabljanja Deepseek-R1 so bistveno nižji v primerjavi z drugimi modeli, kot je Chatgpt O1. Deepseek-R1 naj bi za usposabljanje stalo med 6 milijonov dolarjev, kar je od 16 do 33x cenejše od Chatgpt O1 [3]. Vendar je ta strošek za začetni razvoj in usposabljanje modela, ne za prilagoditev.
2. Prilagoditev in uvajanje na AWS: Pri prilagajanju modelov Deepseek-R1 s funkcijo uvoza modela po meri Amazon Bedrock je treba upoštevati več stroškov:
- Stroški sklepanja: Te temeljijo na številu aktivnih modelnih kopij in njihovem trajanju aktivnosti. Cene na enoto modela po meri (CMU) se razlikujejo glede na dejavnike, kot sta arhitektura in regija. Na primer, cena na CMU na minuto znaša 0,0785 USD [4].
- Stroški skladiščenja: Na CMU so mesečni stroški skladiščenja, kar je 1,95 USD [4]. Število potrebnih CMU je odvisno od arhitekture modela in dolžine konteksta.
3. Primer izračuna stroškov: Za model Deepseek-R1-Distill-Llama-8b, ki zahteva 2 cmus, če je model aktiven 1 uro na dan, bi dnevni stroški sklepanja znašali približno 9,42 USD. V mesecu dni znaša 282,60 dolarja za sklepanje in 3,90 dolarja za shranjevanje, kar ima za posledico skupne ocenjene mesečne stroške 286,50 USD [4].
4. Cene na zahtevo za modele Deepseek: na AWS je cena na zahtevo za modele Deepseek, kot je Deepseek R-1, 0,00135 USD na 1.000 vhodnih žetonov in 0,0054 USD na 1.000 izhodnih žetonov [8]. Ta model cen je uporaben za aplikacije, ki zahtevajo prilagodljivo uporabo brez dolgoročnih obveznosti.
Če povzamemo, prilagajanje modelov Deepseek-R1 vključuje stroške, povezane z uvajanjem modela in uporabo na platformah, kot je AWS, s posebnimi stroški za sklepanje in shranjevanje na podlagi enot modelov po meri. Začetni stroški usposabljanja modela so bistveno nižji od primerljivih modelov, zaradi česar je stroškovno učinkovita možnost za aplikacije AI.
Navedbe:
[1] https://api-docs.deepseek.com/quick_start/Pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-compaparison/
[4] https://repost.aws/questions/Quxrtfsasokh8gl-koga/pricing-model-of-deepseek--distilled-llama-models--amazon-bedrock-custom-model-Import
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-acost-aie-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distilation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/