Při používání DeepSeek-R1 na AWS nebo Azure existuje několik skrytých nákladů a úvah, které by si organizace měly být vědomy:
Skryté náklady na AWS
1. Náklady na infrastrukturu: Zatímco samotný DeepSeek-R1 neposkytuje poplatky za využití přímého modelu, uživatelé platí za spotřebované výpočetní zdroje. AWS účtuje až 124 USD za hodinu za Cloudový server optimalizovaný A-OPTIMIMITIMACE, který může činit téměř 90 000 $ měsíčně za nepřetržité používání [1] [2]. Tato cena je výrazně vyšší než přístup k modelům prostřednictvím API, jako je Meta's Llama 3.1, která stojí 3 $ za 1 milion tokenů [1].
2. Náklady na skladování: U modelů nasazených pomocí vlastního importu modelu Amazon Bedrock Emport je měsíční náklady na úložiště na vlastní modelovou jednotku. Například, pokud model jako DeepSeek-R1-Distill-Llama-8B vyžaduje dva CMU, náklady na měsíční úložiště by byly přibližně 3,90 $ [6].
3. Inferenční náklady: Náklady na inference na vlastních modelech se také liší v závislosti na vzorcích použití. Například, pokud je model Deepseek-R1-Distill-Llama-8B aktivní po dobu jedné hodiny denně, odhadované měsíční inferenční náklady by mohly být kolem 282,60 USD [6].
Skryté náklady na Azure
1. Proměnné ceny: Zákazníci Microsoft Azure nepotřebují vyhrazené servery pro DeepSeek-R1, ale stále platí za základní výpočetní výkon. To vede k proměnlivému oceňování v závislosti na tom, jak efektivně je model spuštěn [1] [2]. Na začátku roku 2025 bylo použití DeepSeek-R1 na Azure hlášeno jako volné, ale podléhají limitům sazeb, což se může změnit [3].
2. Nedostatek jasné cenové dokumentace: Protože DeepSeek-R1 není dosud plně integrován s kalkulačkami Azure s kalkulačkami cen, musí uživatelé kontaktovat tým prodeje nebo podpory pro podrobné informace o cenách [3]. Tento nedostatek transparentnosti může způsobit náročné na plánování rozpočtu.
3.. Úvahy o dodržování a bezpečnosti: Ačkoli to není přímé náklady, nasazení modelů AI, jako je DeepSeek-R1 na cloudových platformách, vyžaduje pečlivé zvážení dodržování předpisů a zabezpečení. Například použití cloudových služeb v regionech s různými zákony o ochraně osobních údajů může přidat složitost a potenciální náklady související s zajištěním dodržování předpisů [5].
Obecné skryté náklady
1. Obavy pro ochranu osobních údajů a bezpečnosti dat: Pokud se organizace rozhodnou používat DeepSeek-R1 prostřednictvím API své mateřské společnosti, které je levnější na 2,19 $ za milion tokenů, musí zvážit riziko ochrany osobních údajů a bezpečnosti dat. Směrování pracovního vytížení prostřednictvím čínských serverů může podrobit citlivé údaje na místní předpisy a potenciálně vyžadovat další opatření na dodržování předpisů [1] [2].
2. Náklady na školení a nasazení: Zatímco vykazované náklady na školení Deepseeku pro model R1 jsou relativně nízké, skutečné výdaje pravděpodobně zahrnují významné investice do infrastruktury, sběru dat a personálu, které nejsou plně zveřejněny [8]. To může ovlivnit dlouhodobé hodnocení provozních nákladů a efektivity.
Stručně řečeno, zatímco DeepSeek-R1 nabízí efektivitu nákladů při zpracování, celkové náklady na jeho použití na AWS nebo Azure zahrnují poplatky za pronájem infrastruktury, potenciální náklady na skladování a variabilní ceny založené na efektivitě použití. Kromě toho mohou dodržování a bezpečnostní úvahy přidat složitost a potenciální výdaje.
Citace:
[1] https://campustechnology.com/articles/2025/02/04/AWS-Microsoft-gootle-Mathers-make-Deepseek-r1-ai-model-available-on-their-platforms.aspx
[2] https://campustechnology.com/articles/2025/02/04/aws-microsoft-gootherothers-make-deepseek-r1-ai-model-available-on-their-platforms.aspx?admgarea=News
[3] https://learn.microsoft.com/en-us/answers/questions/2152620/price-for-sage-of-deepseek-r1
[4] https://promp.16x.engineer/blog/deepseek-r1-cost-psing-speed
[5] https://www.findai.app/comparative-analysis-of-Deepseek-Deployl-Costs-Across-cloud-platforms/
[6] https://repost.aws/questions/QuhcixrtfsAsokh8gl-Kkoga/pricing-model-of-deepseek-r1-distiled-llama-models-with-amazon-bedrock--model-import
[7] https://www.byteplus.com/en/topic/408956
[8] https://www.n-ix.com/deepseek-explaided/