Mettre en place un flux de travail de génération augmentée (Rag) de récupération avec Deepseek sur AWS

Comment mettre en place un flux de travail de génération augmentée (RAG) de récupération avec Deepseek sur AWS

La mise en place d'un flux de travail de génération augmentée (RAG) de récupération avec Deepseek sur AWS implique plusieurs étapes, utilisant principalement Amazon SageMaker et Amazon Opensearch Service. Voici un guide détaillé sur la façon de mettre en œuvre ceci:

Étape 1: Déployez Deepseek-R1 sur Amazon Sagemaker

1. Créez un domaine SageMaker: accédez à Amazon Sagemaker et créez un nouveau domaine. Choisissez l'option "Configuration rapide de l'utilisateur unique" et attendez que la configuration se termine.
2. Déployer le modèle Deepseek-R1: Une fois que votre domaine est prêt, ouvrez SageMaker Studio et déployez le modèle Deepseek-R1. Cette étape consiste à configurer un point de terminaison pour le modèle.

Étape 2: Configurer le service Amazon OpenSearch

1. Créez un domaine OpenSearch: accédez à la console AWS et créez un nouveau domaine OpenSearch. Cela servira de base de données vectorielle pour stocker et récupérer des intégres.
2. Configurez les rôles IAM: Créez des rôles IAM pour gérer les autorisations entre OpenSesearch et SageMaker. Cela comprend des rôles pour invoquer le modèle SageMaker et pour votre utilisateur pour créer des connecteurs.

Étape 3: Configurer les rôles et autorisations IAM

1. Créer un rôle IAM pour l'accès à Sagemaker: ce rôle permet à OpenSesearch d'invoquer le modèle Deepseek sur SageMaker. Attachez les politiques nécessaires pour permettre l'invocation du modèle.
2. Configurer le rôle IAM dans OpenSesearch: Assurez-vous qu'OpenSesearch a les autorisations nécessaires pour interagir avec les modèles SageMaker.

Étape 4: Créer un connecteur OpenSearch

1. Utilisez des scripts pour créer un connecteur: utilisez des scripts Python fournis pour créer un connecteur OpenSearch à SageMaker. Ce connecteur permet à OpenSesearch d'appeler le modèle Deepseek pour la génération de texte.
2. Enregistrez le modèle: utilisez l'API OpenSearch pour enregistrer le modèle Deepseek. Cela implique de spécifier le nom du modèle, le type de fonction et l'ID de connecteur.

Étape 5: Implémentez le flux de travail des chiffons

1. Utilisez des incorporations vectorielles pour la recherche: configurer OpenSearch pour utiliser des incorporations vectorielles pour la recherche sémantique. Cela permet une récupération plus précise des documents pertinents.
2. Intégrer à Deepseek pour la génération de texte: une fois les documents pertinents récupérés, utilisez le modèle Deepseek pour générer des réponses de texte en fonction des informations récupérées.

Étape 6: tester et déployer

1. Testez le système de chiffon: utilisez une question d'échantillon pour tester la capacité du système à récupérer des documents pertinents et à générer des réponses de texte cohérentes.
2. Déployez l'application: une fois testé, déployez l'application RAG pour une utilisation en production, en veillant à ce que tous les composants soient correctement sécurisés et configurés.

Cette configuration exploite les capacités de raisonnement de Deepseek et les fonctionnalités de la base de données vectorielle d'OpenSearch pour créer un flux de travail de chiffon robuste sur AWS. Pour des instructions et des scripts plus détaillés, reportez-vous à la documentation AWS et aux référentiels GitHub liés à Deepseek et OpenSesearch [1] [2] [6].

Citations:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-eepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666