AWSにDeepSeek-R1を展開する場合、ストレージ要件は、特定のAWSストレージサービスの観点から明示的に詳述されていません。ただし、モデル自体には、重量に重要なストレージスペースが必要です。たとえば、完全なDeepSeek-R1モデルはもともと約720GBのフットプリントを持っていますが、最適化により、このサイズは量子化および圧縮技術を通じて131GBまで減少する可能性があります[3]。
AWSの展開については、通常、次の側面を考慮する必要があります。
1。モデルストレージ:モデルの重みは、AWSインスタンスがアクセスできる場所に保存する必要があります。これは、大規模なデータセットとモデルファイルの保存に一般的に使用されるS3バケットに含まれる場合があります。モデルをS3に保存するコストは、使用される領域とストレージクラス(例:標準、標準-IA、1つのゾーン-IAなど)に依存します。
2。インスタンスストレージ:EC2インスタンスでモデルを実行する場合、オペレーティングシステムに十分なストレージ、必要な追加ソフトウェア、およびモデル出力または中間結果に潜在的に一時ストレージが必要です。このストレージは通常、インスタンスのルートボリュームまたは追加のEBSボリュームによって提供されます。
3。推論のためのデータストレージ:推論タスクにモデルを使用している場合、入力データと出力結果に追加のストレージが必要になる場合があります。これは、S3やEBSやインスタンスストアボリュームなどの他のAWSストレージサービスを通じて管理することもできます。
特定のAWSサービスに関しては、Amazon S3は、スケーラビリティと信頼性のためにモデルの重みを保存するためによく使用されます。モデルを実行するために、Amazon EC2インスタンスが一般的に使用され、インスタンスの種類と構成に応じてストレージのニーズがあります。大規模な展開のために、Amazon Sagemakerも利用できます。これは、モデルストレージや推論など、機械学習タスクの管理環境を提供します。
コストの考慮事項のために、AWSのストレージコストは使用される特定のサービスに依存します。たとえば、S3ストレージコストはストレージクラスと地域によって異なりますが、EC2インスタンスコストには計算コンポーネントとストレージコンポーネントの両方が含まれます。さらに、Sagemakerのようなサービスを使用すると、MLタスクに管理された環境を提供することにより、これらのコストの管理を簡素化できます。
引用:
[1] https://dev.to/askyt/deepseek-r1-architecture-training-local-deployment-and-hardware-requirements-3mf8
[2] https://www.byteplus.com/en/topic/383522
[3] https://www.reddit.com/r/selfhosted/comments/1ic8zil/yes_you_can_run_deepseekr1_locally_on_your_device/
[4] https://aws.amazon.com/blogs/machine-learning/deploy-deepseek-r1-distill-models-on-amazon-sagemaker-using-a-large-model-inference-container/
[5] https://www.aboutamazon.com/news/aws/aws-deepseek-r1-fuly-managed-generally-abaible
[6] https://aws.amazon.com/blogs/machine-learning/optimize-hosting-deepseek-r1-distill-models-with-hugging-face-tgi-on-amazon-sagemaker-ai/
[7] https://repost.aws/questions/qu-hcixrtfsasokh8gl-koga/pricing-model-of-deepseek-r1-distill-lama-models-with-amazon-custom-model-import
[8] https://community.aws/content/2z6dlaohx12yunoeas7qb5yth0q/leveraging-deepseek-r1-on-aws?lang = en
[9] https://community.aws/content/2seuhqlpyifswswckzmx585jcksgn/deploying-deepseek-r1-14b-on-amazon-ec2?lang=en
[10] https://aws.amazon.com/blogs/aws/deepseek-r1-now-asas-as-as-as-as-ase- fuly-managed-model-in-amazon-bedrock/
[11] https://vagon.io/blog/a-step-by-step-guide-to-running-deepseek-r1-on-vagon-cloud-desktops