Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Deepseek-R1 modellerini özelleştirmenin maliyeti nedir


Deepseek-R1 modellerini özelleştirmenin maliyeti nedir


Deepseek-R1 modellerini özelleştirmek, özellikle Amazon Web Services (AWS) gibi platformlara dağıtılırken çeşitli maliyet bileşenlerini içerir. Deepseek-R1 modellerinin özelleştirilmesi ve dağıtılmasıyla ilgili maliyetlerin ayrıntılı bir dökümü:

1. Eğitim Maliyetleri: Deepseek-R1'in ilk eğitim maliyeti, ChatGPT O1 gibi diğer modellere göre önemli ölçüde daha düşüktür. Deepseek-R1'in ChatGPT O1'den 16x ila 33x daha ucuz olan 6 milyon dolara mal olduğu tahmin edilmektedir [3]. Bununla birlikte, bu maliyet, özelleştirme için değil, modelin ilk gelişimi ve eğitimi içindir.

2. AWS'de Özelleştirme ve Dağıtım: Amazon Bedrock'un Özel Model İçe Aktarma özelliğini kullanarak Deepseek-R1 modellerini özelleştirirken, dikkate alınması gereken birkaç maliyet vardır:
- Çıkarım Maliyetleri: Bunlar aktif model kopyalarının sayısına ve bunların faaliyet süresine dayanmaktadır. Özel Model Birimi (CMU) başına fiyatlandırma, mimari ve bölge gibi faktörlere bağlı olarak değişir. Örneğin, dakikada CMU başına fiyat 0,0785 $ 'dır [4].
- Depolama Maliyetleri: CMU başına aylık depolama maliyeti vardır, bu da 1.95 $ [4]. Gerekli CMU sayısı modelin mimarisine ve bağlam uzunluğuna bağlıdır.

3. Örnek Maliyet Hesaplaması: 2 CMU gerektiren bir Deepseek-R1-Distill-Llama-8b modeli için, model günde 1 saat aktifse, günlük çıkarım maliyeti yaklaşık 9,42 $ olacaktır. Bir aydan fazla, bu toplam çıkarım için 282,60 $ ve depolama için 3,90 $ 'a, bu da toplam tahmini aylık maliyet 286.50 $' dır [4].

4. Deepseek modelleri için talep üzerine fiyatlandırma: AWS'de, Deepseek R-1 gibi Deepseek modelleri için talep üzerine fiyatlandırma, 1000 giriş jetonları başına 0.00135 $ ve 1000 çıkış belirteçleri başına 0.0054 $ 'dır [8]. Bu fiyatlandırma modeli, uzun vadeli taahhütler olmadan esnek kullanım gerektiren uygulamalar için kullanışlıdır.

Özetle, Deepseek-R1 modellerinin özelleştirilmesi, özel model birimlerine dayalı çıkarım ve depolama için belirli ücretlerle AWS gibi platformlarda model dağıtım ve kullanım ile ilgili maliyetleri içerir. Modelin ilk eğitim maliyeti karşılaştırılabilir modellerden önemli ölçüde daha düşüktür, bu da onu AI uygulamaları için uygun maliyetli bir seçenek haline getirir.

Alıntılar:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolesdudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/questions/quixrtfsasokh8gl-koga/pring-model-of-depseek-r1-disted-llama-modeller-amazon-brock-custom-model-import
[5] https://community.intel.com/t5/blogs/tech-innovation/artical-intigence-ai/discover-the-power-ofseek-r1-cost-ficfic-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pring/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distilation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/