Tùy chỉnh các mô hình DeepSeek-R1 bao gồm một số thành phần chi phí, đặc biệt khi triển khai chúng trên các nền tảng như Amazon Web Services (AWS). Dưới đây là phân tích chi tiết các chi phí liên quan đến việc tùy chỉnh và triển khai các mô hình DeepSeek-R1:
1. Chi phí đào tạo: Chi phí đào tạo ban đầu của DeepSeek-R1 thấp hơn đáng kể so với các mô hình khác như Chatgpt O1. Deepseek-R1 được ước tính có giá từ 6 triệu đô la để đào tạo, rẻ hơn từ 16 lần đến 33 lần so với TATGPT O1 [3]. Tuy nhiên, chi phí này là cho sự phát triển và đào tạo ban đầu của mô hình, không phải để tùy chỉnh.
2. Tùy chỉnh và triển khai trên AWS: Khi tùy chỉnh các mô hình DeepSeek-R1 bằng tính năng nhập mô hình tùy chỉnh của Amazon Bedrock, có một số chi phí để xem xét:
- Chi phí suy luận: Chúng dựa trên số lượng bản sao mô hình hoạt động và thời gian hoạt động của chúng. Giá mỗi đơn vị mô hình tùy chỉnh (CMU) thay đổi tùy thuộc vào các yếu tố như kiến trúc và khu vực. Ví dụ, giá mỗi CMU mỗi phút là 0,0785 đô la [4].
- Chi phí lưu trữ: Có chi phí lưu trữ hàng tháng cho mỗi CMU, là $ 1,95 [4]. Số lượng CMU cần thiết phụ thuộc vào kiến trúc của mô hình và độ dài bối cảnh.
3. Tính toán chi phí ví dụ: Đối với mô hình DeepSeek-R1-Distill-Llama-8B yêu cầu 2 CMU, nếu mô hình hoạt động trong 1 giờ mỗi ngày, chi phí suy luận hàng ngày sẽ khoảng $ 9,42. Trong một tháng, tổng số này lên $ 282,60 cho suy luận và $ 3,90 cho việc lưu trữ, dẫn đến tổng chi phí hàng tháng ước tính là $ 286,50 [4].
4. Giá theo yêu cầu cho các mô hình DeepSeek: Trên AWS, giá theo yêu cầu cho các mẫu Deepseek như DeepSeek R-1 là 0,00135 trên các mã thông báo đầu vào 1.000 và 0,0054 đô la trên 1.000 mã thông báo đầu ra [8]. Mô hình định giá này rất hữu ích cho các ứng dụng yêu cầu sử dụng linh hoạt mà không có các cam kết dài hạn.
Tóm lại, việc tùy chỉnh các mô hình DeepSeek-R1 liên quan đến chi phí liên quan đến triển khai mô hình và sử dụng trên các nền tảng như AWS, với các khoản phí cụ thể để suy luận và lưu trữ dựa trên các đơn vị mô hình tùy chỉnh. Chi phí đào tạo ban đầu của mô hình thấp hơn đáng kể so với các mô hình tương đương, làm cho nó trở thành một tùy chọn tiết kiệm chi phí cho các ứng dụng AI.
Trích dẫn:
[1] https://api-docs.deepseek.com/quick_start/pricing
[2] https://www.together.ai/models/deepseek-r1
.
[4] https://repost.aws/questions/QU-hcixrtFSaSoKH8GL-KogA/pricing-model-of-deepseek-r1-distilled-llama-models-with-amazon-bedrock-custom-model-import
[5] https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Discover-the-Power-of-DeepSeek-R1-A-Cost-Efficient-AI-Model/post/1665557
.
.
[8] https://aws.amazon.com/bedrock/pricing/