Establecer un flujo de trabajo de generación aumentada de recuperación (trapo) con Deepseek en AWS

¿Cómo configuré un flujo de trabajo de generación de recuperación (trapo) con Deepseek en AWS?

La configuración de un flujo de trabajo de generación aumentada de recuperación (RAG) con Deepseek en AWS implica varios pasos, principalmente utilizando el servicio de Amazon Sagemaker y Amazon OpenSearch. Aquí hay una guía detallada sobre cómo implementar esto:

Paso 1: Implementar Deepseek-R1 en Amazon Sagemaker

1. Cree un dominio de Sagemaker: navegue a Amazon Sagemaker y cree un nuevo dominio. Elija la opción "Configuración rápida de usuario único" y espere a que se complete la configuración.
2. Implemente el modelo Deepseek-R1: una vez que su dominio esté listo, abra Sagemaker Studio e implementa el modelo Deepseek-R1. Este paso implica configurar un punto final para el modelo.

Paso 2: Configurar el servicio de Amazon OpenSearch

1. Cree un dominio de OpenSearch: vaya a la consola AWS y cree un nuevo dominio de OpenSearch. Esto servirá como su base de datos de vectores para almacenar y recuperar incrustaciones.
2. Configure los roles IAM: cree roles IAM para administrar los permisos entre OpenSearch y Sagemaker. Esto incluye roles para invocar el modelo Sagemaker y para que su usuario cree conectores.

Paso 3: Configurar roles y permisos de IAM

1. Cree un papel de IAM para el acceso de Sagemaker: este rol permite que OpenSearch invoque el modelo Deepseek en Sagemaker. Adjunte las políticas necesarias para habilitar la invocación del modelo.
2. Configure el papel de IAM en OpenSearch: asegúrese de que OpenSearch tenga los permisos necesarios para interactuar con los modelos Sagemaker.

Paso 4: Crear conector OpenSearch

1. Use scripts para crear conector: utilice los scripts de python proporcionados para crear un conector OpenSearch a Sagemaker. Este conector permite que OpenSearch llame al modelo Deepseek para la generación de texto.
2. Registre el modelo: use la API de OpenSearch para registrar el modelo Deepseek. Esto implica especificar el nombre del modelo, el tipo de función y la ID del conector.

Paso 5: Implementar flujo de trabajo de trapo

1. Use incrustaciones de vectores para la búsqueda: Configure OpenSearch para usar los incrustaciones de vectores para la búsqueda semántica. Esto permite una recuperación más precisa de documentos relevantes.
2. Integrar con Deepseek para la generación de texto: una vez que se recuperen los documentos relevantes, use el modelo Deepseek para generar respuestas de texto basadas en la información recuperada.

Paso 6: Prueba e implementa

1. Pruebe el sistema RAG: use una consulta de muestra para probar la capacidad del sistema para recuperar documentos relevantes y generar respuestas de texto coherentes.
2. Implemente la aplicación: una vez probada, implementa la aplicación RAG para el uso de producción, asegurando que todos los componentes estén correctamente asegurados y configurados.

Esta configuración aprovecha las capacidades de razonamiento de Deepseek y las características de la base de datos Vector de OpenSearch para crear un flujo de trabajo de trapo robusto en AWS. Para obtener instrucciones y scripts más detallados, consulte la documentación de AWS y los repositorios de GitHub relacionados con Deepseek y OpenSearch [1] [2] [6].

Citas:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666