Sette opp en gjenfinning av gjenvinning av augmented Generation (RAG) med DeepSeek på AWS

Hvordan setter jeg opp en gjenfinning av gjenvinning

Å sette opp en gjenfinning av gjenvinning av augmented Generation (RAG) med DeepSeek på AWS innebærer flere trinn, først og fremst ved bruk av Amazon Sagemaker og Amazon OpenSearch Service. Her er en detaljert guide for hvordan du implementerer dette:

Trinn 1: Deploy DeepSeek-R1 på Amazon Sagemaker

1. Opprett et Sagemaker -domene: Naviger til Amazon Sagemaker og lag et nytt domene. Velg alternativet "Single User Quick Setup" og vent til oppsettet skal fullføres.
2. Distribuer DeepSeek-R1-modellen: Når domenet ditt er klart, åpent Sagemaker Studio og distribuerer DeepSeek-R1-modellen. Dette trinnet innebærer å sette opp et endepunkt for modellen.

Trinn 2: Sett opp Amazon OpenSearch Service

1. Opprett et OpenSearch -domene: Gå til AWS -konsollen og lag et nytt OpenSearch -domene. Dette vil fungere som vektordatabasen din for lagring og henting av innebygde.
2. Konfigurer IAM -roller: Opprett IAM -roller for å administrere tillatelser mellom OpenSearch og Sagemaker. Dette inkluderer roller for å påkalle Sagemaker -modellen og for at brukeren din skal lage kontakter.

Trinn 3: Konfigurer IAM -roller og tillatelser

1. Opprett IAM -rolle for Sagemaker Access: Denne rollen gjør at OpenSearch kan påkalle DeepSeek -modellen på Sagemaker. Legg ved nødvendige retningslinjer for å muliggjøre modellkall.
2. Konfigurer IAM -rolle i OpenSearch: Forsikre deg om at OpenSearch har de nødvendige tillatelsene til å samhandle med Sagemaker -modeller.

Trinn 4: Opprett OpenSearch -kontakt

1. Bruk skript for å lage Connector: Bruk ga Python -skript for å lage en OpenSearch -kontakt til Sagemaker. Denne kontakten gjør det mulig for OpenSearch å ringe DeepSeek -modellen for tekstgenerering.
2. Registrer modellen: Bruk OpenSearch API for å registrere DeepSeek -modellen. Dette innebærer å spesifisere modellnavn, funksjonstype og tilkoblings -ID.

Trinn 5: Implementere arbeidsflyt

1. Bruk vektorembeddinger for søk: Konfigurer OpenSearch for å bruke vektorembeddings for semantisk søk. Dette gir mer nøyaktig henting av relevante dokumenter.
2. Integrer med DeepSeek for tekstgenerering: Når relevante dokumenter er hentet, bruk DeepSeek -modellen til å generere tekstresponser basert på den hentede informasjonen.

Trinn 6: Test og distribusjon

1. Test RAG -systemet: Bruk et eksempel på spørringen for å teste systemets evne til å hente relevante dokumenter og generere sammenhengende tekstsvar.
2. Distribuer applikasjonen: Når du er testet, distribuerer du RAG -applikasjonen for produksjonsbruk, og sikrer at alle komponenter er riktig sikret og konfigurert.

Dette oppsettet utnytter DeepSeeks resonnementfunksjoner og OpenSearchs vektordatabasefunksjoner for å lage en robust fillearbeidsflyt på AWS. For mer detaljerte instruksjoner og skript, se AWS -dokumentasjon og GitHub -depoter relatert til DeepSeek og OpenSearch [1] [2] [6].

Sitasjoner:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-depseek-with-azon-opensearch-service-vektor-database-and-azon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/Deepseek--Rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-depseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-depseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666