การปรับแต่งโมเดล Deepseek-R1 นั้นเกี่ยวข้องกับส่วนประกอบต้นทุนหลายอย่างโดยเฉพาะอย่างยิ่งเมื่อปรับใช้กับแพลตฟอร์มเช่น Amazon Web Services (AWS) นี่คือรายละเอียดของค่าใช้จ่ายที่เกี่ยวข้องกับการปรับแต่งและปรับใช้โมเดล Deepseek-R1:
1. ค่าใช้จ่ายในการฝึกอบรม: ค่าใช้จ่ายในการฝึกอบรมเริ่มต้นของ Deepseek-R1 ลดลงอย่างมากเมื่อเทียบกับรุ่นอื่น ๆ เช่น CHATGPT O1 DEEPSEEK-R1 คาดว่าจะมีค่าใช้จ่ายระหว่าง 6 ล้านเหรียญสหรัฐในการฝึกอบรมซึ่งมีราคาถูกกว่า 16x ถึง 33 เท่ากว่า CHATGPT O1 [3] อย่างไรก็ตามค่าใช้จ่ายนี้มีไว้สำหรับการพัฒนาเบื้องต้นและการฝึกอบรมของแบบจำลองไม่ใช่เพื่อการปรับแต่ง
2. การปรับแต่งและการปรับใช้บน AWS: เมื่อปรับแต่งโมเดล DeepSeek-R1 โดยใช้คุณสมบัติการนำเข้าโมเดลที่กำหนดเองของ Amazon Bedrock มีค่าใช้จ่ายหลายประการที่ต้องพิจารณา:
- ค่าใช้จ่ายการอนุมาน: สิ่งเหล่านี้ขึ้นอยู่กับจำนวนสำเนาโมเดลที่ใช้งานอยู่และระยะเวลาของกิจกรรม การกำหนดราคาต่อหน่วยโมเดลที่กำหนดเอง (CMU) แตกต่างกันไปขึ้นอยู่กับปัจจัยเช่นสถาปัตยกรรมและภูมิภาค ตัวอย่างเช่นราคาต่อ CMU ต่อนาทีคือ $ 0.0785 [4]
- ค่าใช้จ่ายในการจัดเก็บ: มีค่าจัดเก็บรายเดือนต่อ CMU ซึ่งคือ $ 1.95 [4] จำนวน CMU ที่ต้องการขึ้นอยู่กับสถาปัตยกรรมและความยาวบริบทของโมเดล
3. ตัวอย่างการคำนวณต้นทุน: สำหรับรุ่น Deepseek-R1-Distill-Llama-8B ที่ต้องการ 2 CMUs หากรุ่นนี้ใช้งานได้ 1 ชั่วโมงต่อวันค่าใช้จ่ายการอนุมานรายวันจะอยู่ที่ประมาณ $ 9.42 มากกว่าหนึ่งเดือนผลรวมนี้เป็น $ 282.60 สำหรับการอนุมานและ $ 3.90 สำหรับการจัดเก็บส่งผลให้ค่าใช้จ่ายรายเดือนโดยประมาณ $ 286.50 [4]
4. การกำหนดราคาตามความต้องการสำหรับรุ่น Deepseek: บน AWS การกำหนดราคาตามความต้องการสำหรับโมเดล Deepseek เช่น Deepseek R-1 คือ $ 0.00135 ต่อโทเค็นอินพุต 1,000 รายการและ $ 0.0054 ต่อ 1,000 โทเค็นเอาท์พุท [8] รูปแบบการกำหนดราคานี้มีประโยชน์สำหรับแอปพลิเคชันที่ต้องการการใช้งานที่ยืดหยุ่นโดยไม่มีภาระผูกพันระยะยาว
โดยสรุปการปรับแต่งโมเดล Deepseek-R1 เกี่ยวข้องกับค่าใช้จ่ายที่เกี่ยวข้องกับการปรับใช้แบบจำลองและการใช้งานบนแพลตฟอร์มเช่น AWS โดยมีค่าใช้จ่ายเฉพาะสำหรับการอนุมานและการจัดเก็บตามหน่วยโมเดลที่กำหนดเอง ต้นทุนการฝึกอบรมเบื้องต้นของโมเดลนั้นต่ำกว่ารุ่นที่เทียบเท่าอย่างมีนัยสำคัญทำให้เป็นตัวเลือกที่ประหยัดต้นทุนสำหรับแอปพลิเคชัน AI
การอ้างอิง:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
[3] https://www.creolestudios.com/deepseek-vs-chatgpt-cost-comparison/
[4] https://repost.aws/Questions/QU-HCIXRTFSASOKH8GL-KOGA/PrICIN
[5] https://community.intel.com/t5/blogs/tech-innovation/artificial-intelligence-ai/discover-the-power-of-deepseek-r1-a-cost-efficient-ai-model/post/1665557
[6] https://team-gpt.com/blog/deepseek-pricing/
[7] https://www.reddit.com/r/machinelearning/comments/1icfbll/d_deepseek_distillation_and_training_costs/
[8] https://aws.amazon.com/bedrock/pricing/