Het opzetten van een ophalen augmented generation (dag) workflow met Deepseek op AWS

Hoe zet ik een ophalende workflow voor augmented generation (dag) op met Deepseek op AWS

Het opzetten van een ophalen van augmented generation (dag) workflow met Deepseek op AWS omvat verschillende stappen, voornamelijk met behulp van Amazon Sagemaker en Amazon OpenSearch -service. Hier is een gedetailleerde gids om dit te implementeren:

Stap 1: implementeer Deepseek-R1 op Amazon Sagemaker

1. Maak een Sagemaker -domein: navigeer naar Amazon Sagemaker en maak een nieuw domein. Kies de optie "Single User Quick Setup" en wacht tot de instelling is voltooid.
2. Implementeer het diepeek-R1-model: Zodra uw domein klaar is, wordt Sagemaker Studio geopend en implementeer het Deepseek-R1-model. Deze stap omvat het opzetten van een eindpunt voor het model.

Stap 2: Amazon OpenSearch Service instellen

1. Maak een OpenSearch -domein: ga naar de AWS -console en maak een nieuw OpenSearch -domein. Dit zal dienen als uw vectordatabase voor het opslaan en ophalen van insluitingen.
2. Configureer IAM -rollen: maak IAM -rollen om machtigingen tussen OpenSearch en Sagemaker te beheren. Dit omvat rollen voor het oproepen van het Sagemaker -model en voor uw gebruiker om connectoren te maken.

Stap 3: IAM -rollen en machtigingen configureren

1. Creëer de IAM -rol voor toegang tot Sagemaker: deze rol stelt OpenSearch in staat om het Deepseek -model op Sagemaker op te roepen. Bevestig het noodzakelijke beleid om modelaanroeping mogelijk te maken.
2. Configureer de IAM -rol in OpenSearch: zorg ervoor dat OpenSearch de nodige machtigingen heeft om te communiceren met Sagemaker -modellen.

STAP 4: CREATE OpenSearch Connector

1. Gebruik scripts om een connector te maken: gebruik verstrekte python -scripts om een OpenSearch -connector aan Sagemaker te maken. Met deze connector kunnen OpenSearch het DeepSeek -model bellen voor het genereren van tekst.
2. Registreer het model: gebruik de OpenSearch API om het DeepSeek -model te registreren. Dit omvat het opgeven van de modelnaam, functietype en connector -ID.

Stap 5: Rag Workflow implementeren

1. Gebruik vectorinbedding voor zoekopdracht: Configureer OpenSearch om vectorinbedding te gebruiken voor semantische zoekopdrachten. Dit zorgt voor een nauwkeuriger ophalen van relevante documenten.
2. Integreer met Deepseek voor het genereren van tekst: gebruik eenmaal relevante documenten opgehaald, gebruik het Deepseek -model om tekstreacties te genereren op basis van de opgehaalde informatie.

Stap 6: test en implementeer

1. Test het voddensysteem: gebruik een voorbeeldquery om het vermogen van het systeem om relevante documenten op te halen te testen en coherente tekstreacties te genereren.
2. Implementeer de toepassing: eenmaal getest, implementeert u de RAG -applicatie voor productiegebruik, zodat alle componenten correct zijn beveiligd en geconfigureerd.

Deze opstelling maakt gebruik van Deepseek's redeneermogelijkheden en de vectordatabasefuncties van OpenSearch om een robuuste rag -workflow op AWS te maken. Raadpleeg AWS -documentatie en GitHub -repositories gerelateerd aan Deepseek en OpenSearch [1] [6] voor meer gedetailleerde instructies en scripts voor meer gedetailleerde instructies en scripts.

Citaten:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/penSearch-project/ml-Commons/Blob/Main/docs/Tutorials/aws/Ag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://pensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666