Nustatykite papildomos kartos (RAG) darbo eigą su „Deepseee“ AWS

Kaip nustatyti paieškos papildytos kartos (RAG) darbo eigą su „Deepseek“ AWS

Nustatykite papildomos kartos (RAG) darbo eigą su „Deepseek“ AWS, reikia kelių veiksmų, pirmiausia naudojant „Amazon Sagemaker“ ir „Amazon OpenSearch“ paslaugą. Čia yra išsamus vadovas, kaip tai įgyvendinti:

1 žingsnis: „Amazon Sagemaker“ diegkite „Deepseek-R1“

1. Sukurkite „Sagemaker“ domeną: eikite į „Amazon Sagemaker“ ir sukurkite naują domeną. Pasirinkite parinktį „Vieno vartotojo greita sąranka“ ir palaukite, kol bus baigta sąranka.
2. Diegkite „Deepseeek-R1“ modelį: Kai jūsų domenas bus paruoštas, atidarykite „Sagemaker Studio“ ir įdėkite „Deepseeek-R1“ modelį. Šis žingsnis apima modelio galutinio taško nustatymą.

2 žingsnis: Nustatykite „Amazon OpenSearch“ paslaugą

1. Sukurkite „OpenSearch“ domeną: eikite į AWS konsolę ir sukurkite naują „OpenSearch“ domeną. Tai bus jūsų vektorinės duomenų bazė, skirta saugoti ir gauti įterpimus.
2. Tai apima „Sagemaker“ modelio iškvietimo vaidmenis ir jūsų vartotojui kurti jungtis.

3 žingsnis: Konfigūruokite IAM vaidmenis ir leidimus

1. Sukurkite „Sagemaker Access“ vaidmenį: Šis vaidmuo leidžia „OpenSearch“ iškviesti „Deepseee“ modelį „Sagemaker“. Pridėkite būtiną politiką, kad būtų galima pašalinti modelį.
2.

4 žingsnis: sukurkite „OpenSearch“ jungtį

1. Norėdami sukurti jungtį, naudokite scenarijus: naudokite pateiktus „Python“ scenarijus, kad sukurtumėte „OpenSearch“ jungtį „Sagemaker“. Ši jungtis leidžia „OpenSearch“ iškviesti teksto generavimo „Deepseee“ modelį.
2. Užregistruokite modelį: naudokite „OpenSearch“ API, kad užregistruotumėte „Deepseee“ modelį. Tai apima modelio pavadinimo, funkcijos tipo ir jungties ID nurodymą.

5 žingsnis: įgyvendinkite skudurų darbo eigą

1. Paieškai naudokite vektorinius įterptuves: sukonfigūruokite „OpenSearch“, kad semantinė paieškai naudotumėte vektorinius įterptuvus. Tai leidžia tiksliau gauti atitinkamus dokumentus.
2. Integruokite su „Deepseek“ teksto generavimui: Gavę svarbius dokumentus, naudokite „Deepseee“ modelį, kad sukurtumėte teksto atsakymus, pagrįstus gauta informacija.

6 žingsnis: išbandykite ir diegkite

1. Išbandykite skudurų sistemą: naudokite pavyzdžio užklausą, kad patikrintumėte sistemos sugebėjimą nuskaityti atitinkamus dokumentus ir generuoti nuoseklius teksto atsakymus.
2. Diegkite programą: Išbandę, įdėkite RAG programą gamybai naudoti, užtikrindami, kad visi komponentai būtų tinkamai pritvirtinti ir sukonfigūruoti.

Ši sąranka pasinaudoja „Deepseek“ samprotavimo galimybėmis ir „OpenSearch“ vektorių duomenų bazės funkcijomis, kad būtų sukurta tvirta RAG darbo eiga AWS. Norėdami gauti išsamesnių instrukcijų ir scenarijų, skaitykite AWS dokumentacijose ir „GitHub“ saugyklose, susijusiose su „Deepseek“ ir „OpenSearch“ [1] [2] [6].

Citatos:
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-mazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-gag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
]
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8f-f3c1-2748-3b9c36468666