Deepseek-R1 mudelite kohandamine hõlmab mitmeid kulukomponente, eriti kui neid juurutaks sellistele platvormidele nagu Amazon Web Services (AWS). Siin on üksikasjalik jaotus DeepSEEK-R1 mudelite kohandamise ja juurutamisega seotud kulude üksikasjalik jaotus:
1. koolituskulud: Deepseek-R1 esialgsed koolituskulud on teiste mudelitega, näiteks ChatGpt O1, oluliselt madalamad. Deepseek-R1 maksab väljaõppeks hinnanguliselt 6 miljonit dollarit, mis on 16x kuni 33x odavam kui Chatgpt O1 [3]. See hind on aga mudeli esialgse väljatöötamise ja koolituse, mitte kohandamise jaoks.
2. Kohandamine ja juurutamine AWS-is: DeepSEEEK-R1 mudelite kohandamisel Amazon Bedrocki kohandatud mudeli impordi funktsiooni abil on mitu kulusid:
- Järelduskulud: need põhinevad aktiivsete mudeli koopiate arvul ja nende aktiivsuse kestusel. Hinnakujundus kohandatud mudeliühiku kohta (CMU) varieerub sõltuvalt sellistest teguritest nagu arhitektuur ja piirkond. Näiteks on CMU hind minutis 0,0785 dollarit [4].
- Ladustamiskulud: CMU kohta on igakuine ladustamiskulud, mis on 1,95 dollarit [4]. Nõutavate CMU -de arv sõltub mudeli arhitektuurist ja konteksti pikkusest.
3. Näide kulude arvutamine: DeepSEEK-R1-Distill-LLAMA-8B mudeli jaoks, mis nõuab 2 cMU-d, kui mudel on aktiivne 1 tund päevas, oleks igapäevane järelduskulud umbes 9,42 dollarit. Üle kuu on see järelduste eest 282,60 dollarit ja ladustamise eest 3,90 dollarit, mille tulemuseks on hinnanguline igakuine maksumus 286,50 dollarit [4].
4. Deepseeki mudelite tellitav hinnakujundus: AWS-il on Deepseeki mudelite nagu Deepseek R-1 tellitav hinnakujundus 0,00135 dollarit 1000 sisendmärgi kohta ja 0,0054 dollarit 1000 väljundmärgi kohta [8]. See hinnamudel on kasulik rakenduste jaoks, mis nõuavad paindlikku kasutamist ilma pikaajaliste kohustusteta.
Kokkuvõtlikult hõlmab DeepSEEK-R1 mudelite kohandamine mudeli juurutamisega seotud kulusid ja kasutamist platvormidel nagu AWS, koos konkreetsete järelduste ja salvestusruumidega, mis põhinevad kohandatud mudeliühikutel. Mudeli esialgsed koolituskulud on oluliselt madalamad kui võrreldavad mudelid, muutes selle AI-rakenduste jaoks kulutõhusaks.
Tsitaadid:
[1] https://api-docs.deepseek.com/quick_start/Priin
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comprong/
]
]
[6] https://team-gpt.com/blog/deepseek-princing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbl
[8] https://aws.amazon.com/bedrock/pricking/