Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Como faço para configurar um fluxo de trabalho de geração aumentada (RAG) com Deepseek na AWS


Como faço para configurar um fluxo de trabalho de geração aumentada (RAG) com Deepseek na AWS


A configuração de um fluxo de trabalho de geração aumentada de recuperação (RAG) com a Deepseek na AWS envolve várias etapas, principalmente usando o Amazon Sagemaker e o Amazon OpenSearch. Aqui está um guia detalhado sobre como implementar isso:

Etapa 1: Implante Deepseek-R1 na Amazon Sagemaker

1. Crie um domínio de sagemaker: navegue até a Amazon Sagemaker e crie um novo domínio. Escolha a opção "Configuração rápida do usuário único" e aguarde a conclusão da configuração.
2. Modelo Deepseek-R1 de implantação: Uma vez que seu domínio estiver pronto, abra o Sagemaker Studio e implante o modelo Deepseek-R1. Esta etapa envolve a configuração de um terminal para o modelo.

Etapa 2: Configurar o serviço de opensearch da Amazon

1. Crie um domínio OpenEarch: vá para o console da AWS e crie um novo domínio OpenEarch. Isso servirá como seu banco de dados vetorial para armazenar e recuperar incorporações.
2. Configure os papéis do IAM: Crie papéis do IAM para gerenciar permissões entre o OpenEarch e Sagemaker. Isso inclui funções para invocar o modelo de sagemaker e para o seu usuário criar conectores.

Etapa 3: Configurar papéis e permissões do IAM

1. Crie um papel do IAM para o acesso ao Sagemaker: Esta função permite que o OpenSearch invocar o modelo Deepseek no Sagemaker. Anexe as políticas necessárias para ativar a invocação do modelo.
2. Configure o papel do IAM no OpenSearch: Verifique se o OpenSearch possui as permissões necessárias para interagir com os modelos Sagemaker.

Etapa 4: Crie o OpenEarch Connector

1. Use scripts para criar o conector: Utilize scripts Python, para criar um conector OpenEarch para Sagemaker. Este conector permite que o OpenSearch chama o modelo Deepseek para geração de texto.
2. Registre o modelo: use a API OpenEarch para registrar o modelo Deepseek. Isso envolve especificar o nome do modelo, o tipo de função e o ID do conector.

Etapa 5: Implemente o fluxo de trabalho do RAG

1. Use incorporação de vetores para pesquisa: Configure o OpenEarch para usar as incorporações do vetor para pesquisa semântica. Isso permite uma recuperação mais precisa dos documentos relevantes.
2. Integrar -se à Deepseek para a geração de texto: Uma vez que os documentos relevantes são recuperados, use o modelo Deepseek para gerar respostas de texto com base nas informações recuperadas.

Etapa 6: Teste e implante

1. Teste o sistema de pano: use uma consulta de amostra para testar a capacidade do sistema de recuperar documentos relevantes e gerar respostas coerentes no texto.
2. Implante o aplicativo: Uma vez testado, implante o aplicativo RAG para uso da produção, garantindo que todos os componentes estejam devidamente protegidos e configurados.

Essa configuração aproveita os recursos de raciocínio da Deepseek e os recursos do banco de dados do Vector da OpenSearch para criar um fluxo de trabalho robusto robusto na AWS. Para obter instruções e scripts mais detalhados, consulte a documentação da AWS e os repositórios do GitHub relacionados a DeepSeek e OpenSearch [1] [2] [6].

Citações:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-erserve-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXeixVuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666