Het opzetten van een ophalen van augmented generation (dag) workflow met Deepseek op AWS omvat verschillende stappen, voornamelijk met behulp van Amazon Sagemaker en Amazon OpenSearch -service. Hier is een gedetailleerde gids om dit te implementeren:
Stap 1: implementeer Deepseek-R1 op Amazon Sagemaker
1. Maak een Sagemaker -domein: navigeer naar Amazon Sagemaker en maak een nieuw domein. Kies de optie "Single User Quick Setup" en wacht tot de instelling is voltooid.
2. Implementeer het diepeek-R1-model: Zodra uw domein klaar is, wordt Sagemaker Studio geopend en implementeer het Deepseek-R1-model. Deze stap omvat het opzetten van een eindpunt voor het model.
Stap 2: Amazon OpenSearch Service instellen
1. Maak een OpenSearch -domein: ga naar de AWS -console en maak een nieuw OpenSearch -domein. Dit zal dienen als uw vectordatabase voor het opslaan en ophalen van insluitingen.
2. Configureer IAM -rollen: maak IAM -rollen om machtigingen tussen OpenSearch en Sagemaker te beheren. Dit omvat rollen voor het oproepen van het Sagemaker -model en voor uw gebruiker om connectoren te maken.
Stap 3: IAM -rollen en machtigingen configureren
1. Creëer de IAM -rol voor toegang tot Sagemaker: deze rol stelt OpenSearch in staat om het Deepseek -model op Sagemaker op te roepen. Bevestig het noodzakelijke beleid om modelaanroeping mogelijk te maken.
2. Configureer de IAM -rol in OpenSearch: zorg ervoor dat OpenSearch de nodige machtigingen heeft om te communiceren met Sagemaker -modellen.
STAP 4: CREATE OpenSearch Connector
1. Gebruik scripts om een connector te maken: gebruik verstrekte python -scripts om een OpenSearch -connector aan Sagemaker te maken. Met deze connector kunnen OpenSearch het DeepSeek -model bellen voor het genereren van tekst.
2. Registreer het model: gebruik de OpenSearch API om het DeepSeek -model te registreren. Dit omvat het opgeven van de modelnaam, functietype en connector -ID.
Stap 5: Rag Workflow implementeren
1. Gebruik vectorinbedding voor zoekopdracht: Configureer OpenSearch om vectorinbedding te gebruiken voor semantische zoekopdrachten. Dit zorgt voor een nauwkeuriger ophalen van relevante documenten.
2. Integreer met Deepseek voor het genereren van tekst: gebruik eenmaal relevante documenten opgehaald, gebruik het Deepseek -model om tekstreacties te genereren op basis van de opgehaalde informatie.
Stap 6: test en implementeer
1. Test het voddensysteem: gebruik een voorbeeldquery om het vermogen van het systeem om relevante documenten op te halen te testen en coherente tekstreacties te genereren.
2. Implementeer de toepassing: eenmaal getest, implementeert u de RAG -applicatie voor productiegebruik, zodat alle componenten correct zijn beveiligd en geconfigureerd.
Deze opstelling maakt gebruik van Deepseek's redeneermogelijkheden en de vectordatabasefuncties van OpenSearch om een robuuste rag -workflow op AWS te maken. Raadpleeg AWS -documentatie en GitHub -repositories gerelateerd aan Deepseek en OpenSearch [1] [6] voor meer gedetailleerde instructies en scripts voor meer gedetailleerde instructies en scripts.
Citaten:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/penSearch-project/ml-Commons/Blob/Main/docs/Tutorials/aws/Ag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://pensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666