Configurando um fluxo de trabalho de geração aumentada (RAG) com Deepseek na AWS

Como faço para configurar um fluxo de trabalho de geração aumentada (RAG) com Deepseek na AWS

A configuração de um fluxo de trabalho de geração aumentada de recuperação (RAG) com a Deepseek na AWS envolve várias etapas, principalmente usando o Amazon Sagemaker e o Amazon OpenSearch. Aqui está um guia detalhado sobre como implementar isso:

Etapa 1: Implante Deepseek-R1 na Amazon Sagemaker

1. Crie um domínio de sagemaker: navegue até a Amazon Sagemaker e crie um novo domínio. Escolha a opção "Configuração rápida do usuário único" e aguarde a conclusão da configuração.
2. Modelo Deepseek-R1 de implantação: Uma vez que seu domínio estiver pronto, abra o Sagemaker Studio e implante o modelo Deepseek-R1. Esta etapa envolve a configuração de um terminal para o modelo.

Etapa 2: Configurar o serviço de opensearch da Amazon

1. Crie um domínio OpenEarch: vá para o console da AWS e crie um novo domínio OpenEarch. Isso servirá como seu banco de dados vetorial para armazenar e recuperar incorporações.
2. Configure os papéis do IAM: Crie papéis do IAM para gerenciar permissões entre o OpenEarch e Sagemaker. Isso inclui funções para invocar o modelo de sagemaker e para o seu usuário criar conectores.

Etapa 3: Configurar papéis e permissões do IAM

1. Crie um papel do IAM para o acesso ao Sagemaker: Esta função permite que o OpenSearch invocar o modelo Deepseek no Sagemaker. Anexe as políticas necessárias para ativar a invocação do modelo.
2. Configure o papel do IAM no OpenSearch: Verifique se o OpenSearch possui as permissões necessárias para interagir com os modelos Sagemaker.

Etapa 4: Crie o OpenEarch Connector

1. Use scripts para criar o conector: Utilize scripts Python, para criar um conector OpenEarch para Sagemaker. Este conector permite que o OpenSearch chama o modelo Deepseek para geração de texto.
2. Registre o modelo: use a API OpenEarch para registrar o modelo Deepseek. Isso envolve especificar o nome do modelo, o tipo de função e o ID do conector.

Etapa 5: Implemente o fluxo de trabalho do RAG

1. Use incorporação de vetores para pesquisa: Configure o OpenEarch para usar as incorporações do vetor para pesquisa semântica. Isso permite uma recuperação mais precisa dos documentos relevantes.
2. Integrar -se à Deepseek para a geração de texto: Uma vez que os documentos relevantes são recuperados, use o modelo Deepseek para gerar respostas de texto com base nas informações recuperadas.

Etapa 6: Teste e implante

1. Teste o sistema de pano: use uma consulta de amostra para testar a capacidade do sistema de recuperar documentos relevantes e gerar respostas coerentes no texto.
2. Implante o aplicativo: Uma vez testado, implante o aplicativo RAG para uso da produção, garantindo que todos os componentes estejam devidamente protegidos e configurados.

Essa configuração aproveita os recursos de raciocínio da Deepseek e os recursos do banco de dados do Vector da OpenSearch para criar um fluxo de trabalho robusto robusto na AWS. Para obter instruções e scripts mais detalhados, consulte a documentação da AWS e os repositórios do GitHub relacionados a DeepSeek e OpenSearch [1] [2] [6].

Citações:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-erserve-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXeixVuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666