A DeepSeek-R1 modellek testreszabása számos költségkomponenssel jár, különösen akkor, ha azokat olyan platformon telepítik, mint az Amazon Web Services (AWS). Itt található a mélySeek-R1 modellek testreszabásával és telepítésével kapcsolatos költségek részletes bontása:
1. Képzési költségek: A DeepSeek-R1 kezdeti képzési költségei jelentősen alacsonyabbak, mint más modellek, például a Chatgpt O1. A DeepSeek-R1 becslések szerint 6 millió dollárba kerül a kiképzés, ami 16x és 33x olcsóbb, mint a Chatgpt O1 [3]. Ez a költség azonban a modell kezdeti fejlesztésére és képzésére, nem pedig a testreszabásra.
2. Testreszabás és telepítés az AWS-en: A DeepSeek-R1 modellek testreszabásakor az Amazon BedRock egyedi modell importálási funkciójával számos költség van:
- Következési költségek: Ezek az aktív modell példányok számán és azok aktivitásának időtartamán alapulnak. Az egyéni modellegység (CMU) szerinti ára az architektúrától és a régiótól függően változik. Például, a CMU -nkénti percenkénti ár 0,0785 USD [4].
- Tárolási költségek: CMU -nként havi tárolási költség, amely 1,95 USD [4]. A szükséges CMU -k száma a modell architektúrájától és a kontextus hosszától függ.
3. példa Költségszámítás: A mélymagos-R1-Distill-LLAMA-8B modell esetében 2 CMU-t igényel, ha a modell napi 1 órán keresztül aktív, a napi következtetési költségek körülbelül 9,42 dollár lenne. Egy hónap alatt ez 282,60 USD -ig tart a következtetéshez és 3,90 dollár tároláshoz, így a becsült havi költségek összesen 286,50 USD -t jelentenek [4].
4. A DeepSeek modellek igény szerinti árazása: Az AWS-en a DeepSeek modellek, például a DeepSeek R-1 igény szerinti árazása 0,00135 USD / 1000 bemeneti token és 0,0054 USD / 1000 output token [8]. Ez az árképzési modell hasznos olyan alkalmazásoknál, amelyek hosszú távú kötelezettségvállalások nélkül rugalmas felhasználást igényelnek.
Összefoglalva: a mélySeek-R1 modellek testreszabása magában foglalja a modellek telepítésével és felhasználásával kapcsolatos költségeket, mint például az AWS, az egyéni modellegységek alapján a következtetés és a tárolás konkrét díjaival. A modell kezdeti képzési költsége lényegesen alacsonyabb, mint az összehasonlítható modellek, így költséghatékony opcióvá válik az AI alkalmazásokhoz.
Idézetek:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8glkoga/pricing-model-of-deepseek-r1-distlad-lama-models-with-amazon-bedrock-custom-model-mport
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-a-cost-effien-ac-model/post/1665557
[6] https://teamgpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/