Opsætning af en hentning Augmented Generation (RAG) Workflow med Deepseek på AWS

Hvordan opretter jeg en hentning augmented generation (RAG) arbejdsgang med Deepseek på AWS

Opsætning af en hentning Augmented Generation (RAG) Workflow med Deepseek på AWS involverer flere trin, primært ved hjælp af Amazon Sagemaker og Amazon OpenSearch Service. Her er en detaljeret guide til, hvordan man implementerer dette:

Trin 1: Deploy Deepseek-R1 på Amazon Sagemaker

1. Opret et Sagemaker -domæne: Naviger til Amazon Sagemaker og skab et nyt domæne. Vælg indstillingen "enkelt bruger hurtig opsætning", og vent på, at opsætningen skal afsluttes.
2. Distribuer DeepSeek-R1-modellen: Når dit domæne er klar, skal du åbne Sagemaker Studio og implementere DeepSeek-R1-modellen. Dette trin involverer opsætning af et slutpunkt for modellen.

Trin 2: Opret Amazon OpenSearch Service

1. Opret et OpenSearch -domæne: Gå til AWS -konsollen og opret et nyt OpenSearch -domæne. Dette vil fungere som din Vector -database til lagring og hentning af indlejringer.
2. Konfigurer IAM -roller: Opret IAM -roller til at styre tilladelser mellem OpenSearch og Sagemaker. Dette inkluderer roller til at påkalde Sagemaker -modellen og for din bruger at oprette stik.

Trin 3: Konfigurer IAM -roller og tilladelser

1. Opret IAM -rolle for Sagemaker Access: Denne rolle giver OpenSearch mulighed for at påkalde Deepseek -modellen på Sagemaker. Vedhæft de nødvendige politikker for at muliggøre modelopkald.
2. Konfigurer IAM -rolle i OpenSearch: Sørg for, at OpenSearch har de nødvendige tilladelser til at interagere med Sagemaker -modeller.

Trin 4: Opret OpenSearch Connector

1. Brug scripts til at oprette stik: Brug leverede Python -scripts til at oprette et OpenSearch -stik til Sagemaker. Dette stik gør det muligt for OpenSearch at kalde DEPSEEK -modellen til tekstgenerering.
2. Registrer modellen: Brug OpenSearch API til at registrere dybseek -modellen. Dette involverer at specificere modelnavnet, funktionstypen og Connector ID.

Trin 5: Implement

1. Brug Vector -indlejringer til søgning: Konfigurer OpenSearch til at bruge vektorindlejringer til semantisk søgning. Dette giver mulighed for mere nøjagtig hentning af relevante dokumenter.
2. Integrer med Deepseek til tekstgenerering: Når relevante dokumenter er hentet, skal du bruge DeepSeek -modellen til at generere tekstsvar baseret på de hentede oplysninger.

Trin 6: Test og implementering

1. Test RAG -systemet: Brug en prøveforespørgsel til at teste systemets evne til at hente relevante dokumenter og generere sammenhængende tekstsvar.
2. Implementere applikationen: Når den er testet, skal du implementere RAG -applikationen til produktionsbrug, og sikre, at alle komponenter er korrekt sikret og konfigureret.

Denne opsætning udnytter Deepseeks ræsonnementsfunktioner og OpenSearchs vektordatabasefunktioner til at skabe en robust klud -arbejdsgang på AWS. For mere detaljerede instruktioner og scripts, se AWS -dokumentation og GitHub -lagre relateret til Deepseek og OpenSearch [1] [2] [6].

Citater:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
)
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
)
)
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666