Přizpůsobení modelů DeepSeek-R1 zahrnuje několik komponent nákladů, zejména při jejich nasazení na platformách, jako je Amazon Web Services (AWS). Zde je podrobné rozdělení nákladů spojených s přizpůsobováním a nasazením modelů DeepSeek-R1:
1. Náklady na školení: Počáteční náklady na školení na DeepSeek-R1 jsou výrazně nižší ve srovnání s jinými modely, jako je Chatgpt O1. Odhaduje se, že DeepSeek-R1 stojí mezi 6 miliony dolarů, což je o 16x až 33x levnější než Chatgpt O1 [3]. Tyto náklady se však týkají počátečního vývoje a školení modelu, nikoli pro přizpůsobení.
2. Přizpůsobení a nasazení na AWS: Při přizpůsobení modelů DeepSeek-R1 pomocí vlastní funkce importu modelu Amazon Bedrock je třeba zvážit několik nákladů:
- Inferenční náklady: Jsou založeny na počtu aktivních kopií modelu a jejich trvání aktivity. Ceny na vlastní modelovou jednotku (CMU) se liší v závislosti na faktorech, jako je architektura a region. Například cena za CMU za minutu je 0,0785 $ [4].
- Náklady na skladování: Náklady na měsíční úložiště na CMU, což je 1,95 $ [4]. Počet požadovaných CMU závisí na architektuře modelu a délce kontextu.
3. Příklad výpočtu nákladů: U modelu DeepSeek-R1-Distill-Llama-8B vyžadující 2 CMU, pokud je model aktivní po dobu 1 hodiny denně, denní inferenční náklady by byly přibližně 9,42 $. Během měsíce se jedná o 282,60 USD za inference a 3,90 USD za skladování, což má za následek celkové odhadované měsíční náklady 286,50 USD [4].
4. Ceny na vyžádání pro modely Deepseek: Na AWS je cena na vyžádání pro modely DeepSeek, jako je DeepSeek R-1, 0,00135 USD za 1 000 vstupních tokenů a 0,0054 USD za 1 000 výstupních tokenů [8]. Tento cenový model je užitečný pro aplikace, které vyžadují flexibilní použití bez dlouhodobých závazků.
Stručně řečeno, přizpůsobení modelů DeepSeek-R1 zahrnuje náklady související s nasazením modelu a využití na platformách, jako je AWS, se specifickými poplatky za inference a skladování založené na vlastních modelových jednotkách. Počáteční náklady na školení modelu jsou výrazně nižší než srovnatelné modely, což z něj činí nákladově efektivní možnost pro aplikace AI.
Citace:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/QuhcixrtfsAsokH8gl-Kkoga/pricing-model-of-deeepseek-r1-distiled-llama-models-with-amazon-bedrock--model-import
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/Discover-the-co-feeepseek-r1-a-cost-efticent-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distilation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/