La configuración de un flujo de trabajo de generación aumentada de recuperación (RAG) con Deepseek en AWS implica varios pasos, principalmente utilizando el servicio de Amazon Sagemaker y Amazon OpenSearch. Aquí hay una guía detallada sobre cómo implementar esto:
Paso 1: Implementar Deepseek-R1 en Amazon Sagemaker
1. Cree un dominio de Sagemaker: navegue a Amazon Sagemaker y cree un nuevo dominio. Elija la opción "Configuración rápida de usuario único" y espere a que se complete la configuración.
2. Implemente el modelo Deepseek-R1: una vez que su dominio esté listo, abra Sagemaker Studio e implementa el modelo Deepseek-R1. Este paso implica configurar un punto final para el modelo.
Paso 2: Configurar el servicio de Amazon OpenSearch
1. Cree un dominio de OpenSearch: vaya a la consola AWS y cree un nuevo dominio de OpenSearch. Esto servirá como su base de datos de vectores para almacenar y recuperar incrustaciones.
2. Configure los roles IAM: cree roles IAM para administrar los permisos entre OpenSearch y Sagemaker. Esto incluye roles para invocar el modelo Sagemaker y para que su usuario cree conectores.
Paso 3: Configurar roles y permisos de IAM
1. Cree un papel de IAM para el acceso de Sagemaker: este rol permite que OpenSearch invoque el modelo Deepseek en Sagemaker. Adjunte las políticas necesarias para habilitar la invocación del modelo.
2. Configure el papel de IAM en OpenSearch: asegúrese de que OpenSearch tenga los permisos necesarios para interactuar con los modelos Sagemaker.
Paso 4: Crear conector OpenSearch
1. Use scripts para crear conector: utilice los scripts de python proporcionados para crear un conector OpenSearch a Sagemaker. Este conector permite que OpenSearch llame al modelo Deepseek para la generación de texto.
2. Registre el modelo: use la API de OpenSearch para registrar el modelo Deepseek. Esto implica especificar el nombre del modelo, el tipo de función y la ID del conector.
Paso 5: Implementar flujo de trabajo de trapo
1. Use incrustaciones de vectores para la búsqueda: Configure OpenSearch para usar los incrustaciones de vectores para la búsqueda semántica. Esto permite una recuperación más precisa de documentos relevantes.
2. Integrar con Deepseek para la generación de texto: una vez que se recuperen los documentos relevantes, use el modelo Deepseek para generar respuestas de texto basadas en la información recuperada.
Paso 6: Prueba e implementa
1. Pruebe el sistema RAG: use una consulta de muestra para probar la capacidad del sistema para recuperar documentos relevantes y generar respuestas de texto coherentes.
2. Implemente la aplicación: una vez probada, implementa la aplicación RAG para el uso de producción, asegurando que todos los componentes estén correctamente asegurados y configurados.
Esta configuración aprovecha las capacidades de razonamiento de Deepseek y las características de la base de datos Vector de OpenSearch para crear un flujo de trabajo de trapo robusto en AWS. Para obtener instrucciones y scripts más detallados, consulte la documentación de AWS y los repositorios de GitHub relacionados con Deepseek y OpenSearch [1] [2] [6].
Citas:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666