Menyesuaikan model Deepseek-R1 melibatkan beberapa komponen biaya, terutama ketika menggunakannya di platform seperti Amazon Web Services (AWS). Berikut adalah rincian terperinci dari biaya yang terkait dengan menyesuaikan dan menggunakan model Deepseek-R1:
1. Biaya pelatihan: Biaya pelatihan awal Deepseek-R1 secara signifikan lebih rendah dibandingkan dengan model lain seperti ChatGPT O1. Deepseek-R1 diperkirakan menelan biaya antara $ 6 juta untuk berlatih, yaitu 16x hingga 33x lebih murah daripada chatgpt O1 [3]. Namun, biaya ini untuk pengembangan awal dan pelatihan model, bukan untuk kustomisasi.
2. Kustomisasi dan Penerapan di AWS: Saat menyesuaikan model Deepseek-R1 menggunakan fitur impor model kustom Amazon Bedrock, ada beberapa biaya yang perlu dipertimbangkan:
- Biaya inferensi: Ini didasarkan pada jumlah salinan model aktif dan durasi aktivitasnya. Harga per Unit Model Kustom (CMU) bervariasi tergantung pada faktor -faktor seperti arsitektur dan wilayah. Misalnya, harga per CMU per menit adalah $ 0,0785 [4].
- Biaya penyimpanan: Ada biaya penyimpanan bulanan per CMU, yaitu $ 1,95 [4]. Jumlah CMU yang dibutuhkan tergantung pada arsitektur model dan panjang konteks.
3. Contoh Perhitungan Biaya: Untuk model Deepseek-R1-Distill-Llama-8B yang membutuhkan 2 CMU, jika model tersebut aktif selama 1 jam per hari, biaya inferensi harian akan sekitar $ 9,42. Lebih dari sebulan, ini total menjadi $ 282,60 untuk inferensi dan $ 3,90 untuk penyimpanan, menghasilkan total perkiraan biaya bulanan $ 286,50 [4].
4. Harga sesuai permintaan untuk model Deepseek: Di AWS, harga sesuai permintaan untuk model Deepseek seperti Deepseek R-1 adalah $ 0,00135 per 1.000 token input dan $ 0,0054 per 1.000 token output [8]. Model penetapan harga ini berguna untuk aplikasi yang membutuhkan penggunaan fleksibel tanpa komitmen jangka panjang.
Singkatnya, menyesuaikan model Deepseek-R1 melibatkan biaya yang terkait dengan penyebaran model dan penggunaan pada platform seperti AWS, dengan biaya khusus untuk inferensi dan penyimpanan berdasarkan unit model khusus. Biaya pelatihan awal model secara signifikan lebih rendah daripada model yang sebanding, menjadikannya opsi hemat biaya untuk aplikasi AI.
Kutipan:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-catgpt-cost-comparison/
[4] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-r1-distilled-llama-models-with-amazon-bedrock-custom-model-import
[5] https://community.intel.com/t5/blogs/tech-inovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-a-cost-eficient-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/