Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Aké sú náklady na prispôsobenie modelov Deepseek-R1


Aké sú náklady na prispôsobenie modelov Deepseek-R1


Prispôsobenie modelov Deepseek-R1 zahŕňa niekoľko komponentov nákladov, najmä pri ich nasadení na platformy, ako sú Amazon Web Services (AWS). Tu je podrobné rozdelenie nákladov spojených s prispôsobovaním a nasadením modelov Deepseek-R1:

1. Náklady na školenie: Počiatočné náklady na školenie Deepseek-R1 sú výrazne nižšie v porovnaní s inými modelmi, ako je Chatgpt O1. Odhaduje sa, že Deepseek-R1 bude trvať 6 miliónov dolárov, čo je 16x až 33x lacnejšie ako Chatgpt O1 [3]. Táto cena je však určená na počiatočný vývoj a školenie modelu, nie na prispôsobenie.

2. Prispôsobenie a nasadenie na AWS: Pri prispôsobovaní modelov Deepseek-R1 pomocou funkcie Importu vlastného modelu Amazon Bedrock je potrebné zvážiť niekoľko nákladov:
- Náklady na inferenciu: Sú založené na počte aktívnych kópií modelu a ich trvaní aktivity. Ceny za jednotku vlastného modelu (CMU) sa líši v závislosti od faktorov, ako je architektúra a región. Napríklad cena za cMU za minútu je 0,0785 USD [4].
- Náklady na skladovanie: Existujú mesačné náklady na skladovanie za CMU, čo je 1,95 USD [4]. Počet požadovaných CMU závisí od architektúry a dĺžky kontextu modelu.

3. Príklad Výpočet nákladov: Pre model Deepseek-R1-Distill-Llama-8B vyžadujúci 2 CMU, ak je model aktívny po dobu 1 hodiny denne, náklady na denné odvodenie by boli približne 9,42 dolárov. Za mesiac to predstavuje 282,60 dolárov za odvodenie a 3,90 dolárov na ukladanie, čo viedlo k celkovým odhadovaným mesačným nákladom 286,50 dolárov [4].

4. Ceny na požiadanie pre modely DeepSeek: Na AWS je cena na požiadanie pre modely DeepSeek, ako je Deepseek R-1, 0,00135 USD na 1 000 vstupných žetónov a 0,0054 USD za 1 000 výstupných žetónov [8]. Tento cetový model je užitočný pre aplikácie, ktoré vyžadujú flexibilné využitie bez dlhodobých záväzkov.

Stručne povedané, prispôsobenie modelov DeepSeek-R1 zahŕňa náklady súvisiace s nasadením modelu a využívania na platformách, ako je AWS, so špecifickými poplatkami za inferenciu a úložisko založené na jednotkách vlastných modelov. Počiatočné náklady na školenie modelu sú výrazne nižšie ako porovnateľné modely, čo z nej robí nákladovo efektívnu možnosť pre aplikácie AI.

Citácie:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
Https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-r1-distille-llama-models-with-amazon-bedrock-custom-model-import
Https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-a-cost-effection-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/