AWSのDeepSeekを使用した検索拡張生成(RAG)ワークフローのセットアップには、主にAmazon SagemakerとAmazon Opensearch Serviceを使用します。これを実装する方法に関する詳細なガイドは次のとおりです。
###ステップ1:Amazon SagemakerにDeepseek-R1を展開します
1.セージメーカードメインを作成する:Amazon Sagemakerに移動し、新しいドメインを作成します。 「シングルユーザークイックセットアップ」オプションを選択し、セットアップが完了するのを待ちます。
2. Deepseek-R1モデルの展開:ドメインの準備ができたら、Sagemaker Studioを開き、DeepSeek-R1モデルを展開します。このステップでは、モデルのエンドポイントを設定します。
###ステップ2:Amazon OpenSearchサービスをセットアップします
1. OpenSearchドメインを作成する:AWSコンソールに移動し、新しいOpenSearchドメインを作成します。これは、埋め込みを保存および取得するためのベクトルデータベースとして機能します。
2。IAMの役割の構成:OpenSearchとSagemakerの間の権限を管理するIAMロールを作成します。これには、Sagemakerモデルを呼び出し、ユーザーがコネクタを作成するための役割が含まれます。
###ステップ3:IAMの役割と権限を構成します
1. SagemakerアクセスのIAM役割の作成:この役割により、OpenSearchはSagemakerのDeepSeekモデルを呼び出すことができます。モデルの呼び出しを有効にするために必要なポリシーを添付します。
2。OpenSearchでIAMの役割を構成する:OpenSearchにSageMakerモデルと対話するために必要なアクセス許可があることを確認します。
###ステップ4:OpenSearchコネクタを作成します
1.スクリプトを使用してコネクタを作成します。このコネクタにより、OpenSearchはテキスト生成のDeepSeekモデルを呼び出すことができます。
2。モデルの登録:OpenSearch APIを使用して、DeepSeekモデルを登録します。これには、モデル名、関数タイプ、およびコネクタIDの指定が含まれます。
###ステップ5:RAGワークフローを実装します
1.検索にベクトル埋め込みを使用:セマンティック検索にベクトル埋め込みを使用するようにOpenSearchを構成します。これにより、関連するドキュメントのより正確な検索が可能になります。
2。テキスト生成のためにDeepSeekと統合:関連するドキュメントが取得されたら、DeepSeekモデルを使用して、取得した情報に基づいてテキスト応答を生成します。
###ステップ6:テストと展開
1. RAGシステムのテスト:サンプルクエリを使用して、関連するドキュメントを取得し、コヒーレントテキスト応答を生成するシステムの機能をテストします。
2。アプリケーションの展開:テストしたら、生産用にRAGアプリケーションを展開し、すべてのコンポーネントが適切に保護され、構成されていることを確認します。
このセットアップは、DeepSeekの推論機能とOpenSearchのVectorデータベース機能を活用して、AWSに堅牢なRAGワークフローを作成します。より詳細な指示とスクリプトについては、DeepSeekとOpenSearch [1] [2] [6]に関連するAWSドキュメントとGitHubリポジトリを参照してください。
引用:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666