„Deepseeek-R1“ modelių pritaikymas apima keletą išlaidų komponentų, ypač kai juos diegti tokiose platformose kaip „Amazon Web Services“ (AWS). Čia pateiktas išsamus išlaidų, susijusių su „Deepseeek-R1“ modelių pritaikymu ir diegimu, suskirstymas:
1. Mokymo išlaidos: Pradinės „Deepseek-R1“ mokymo išlaidos yra žymiai mažesnės, palyginti su kitais modeliais, tokiais kaip „ChatGPT O1“. Manoma, kad „Deepseek-R1“ mokymui kainuos nuo 6 milijonų dolerių, tai yra nuo 16x iki 33x pigiau nei „ChatGPT O1“ [3]. Tačiau šios išlaidos yra skirtos pradiniam modelio kūrimo ir mokymo, o ne pritaikymui.
2.
- Išvadų išlaidos: jos grindžiamos aktyvių modelių kopijų skaičiumi ir jų veiklos trukme. Kainos pagal pasirinktinį modelio bloką (CMU) skiriasi priklausomai nuo tokių veiksnių kaip architektūra ir regionas. Pavyzdžiui, CMU per minutę kaina yra 0,0785 USD [4].
- Sandėliavimo išlaidos: yra mėnesinės saugojimo išlaidos už CMU, tai yra 1,95 USD [4]. Reikalingas CMU skaičius priklauso nuo modelio architektūros ir konteksto ilgio.
3. Kainų skaičiavimo pavyzdys: „DeepSeeek-R1-Distill-Llama-8B“ modeliui, kuriam reikia 2 cMU, jei modelis yra aktyvus 1 valandą per dieną, dienos išvados išlaidos būtų maždaug 9,42 USD. Daugiau nei mėnesį iš viso sudaroma 282,60 USD už išvadą ir 3,90 USD už saugojimą, todėl iš viso apskaičiuota 286,50 USD mėnesio kaina [4].
4. „Deepseeek“ modelių kainų nustatymas pagal pareikalavimą: „Deepseeek“ modelių, tokių kaip „Deepseeek R-1“, kainų nustatymas pagal pareikalavimą yra 0,00135 USD už 1 000 įvesties žetonų ir 0,0054 USD už 1 000 išvesties žetonų [8]. Šis kainų nustatymo modelis yra naudingas programoms, kurioms reikalingas lankstus naudojimas be ilgalaikių įsipareigojimų.
Apibendrinant galima pasakyti, kad pritaikymas „Deepseek-R1“ modeliams apima išlaidas, susijusias su modelio diegimu ir naudojimu tokiose platformose kaip AWS, su konkrečiais mokesčiais už išvadą ir saugojimą, pagrįstą pasirinktinių modelių vienetais. Pradinė modelio mokymo kaina yra žymiai mažesnė nei palyginami modeliai, todėl tai yra ekonomiškai efektyvus AI programų pasirinkimas.
Citatos:
[1] https://api-docs.deepseek.com/quick_start/Pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparion/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-r1-distilled-llama-models-with-amazon-bedrock-custom-model-import
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-a-cost-fost-feficit-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-carting/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distilation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/