Configurarea unui flux de lucru pentru generare de regăsire (RAG) cu Deepseek pe AWS

Cum stabilesc un flux de lucru cu generație (RAG) cu regăsire (RAG) cu Deepseek pe AWS

Configurarea unui flux de lucru cu generație augmentată de regăsire (RAG) cu DeepSeek pe AWS implică mai mulți pași, în principal folosind Amazon Sagemaker și Amazon OpenSearch Service. Iată un ghid detaliat despre cum să implementăm acest lucru:

Pasul 1: Deepseek-R1 pe Amazon Sagemaker

1. Creați un domeniu de sagemaker: navigați la Amazon Sagemaker și creați un nou domeniu. Alegeți opțiunea „Configurare rapidă a utilizatorului” și așteptați finalizarea configurației.
2. Deploy DeepSeek-R1 Model: odată ce domeniul dvs. este gata, deschideți Sagemaker Studio și implementați modelul DeepSeek-R1. Acest pas implică configurarea unui punct final pentru model.

Pasul 2: Configurați serviciul Amazon OpenSearch

1. Creați un domeniu OpenSearch: Accesați consola AWS și creați un nou domeniu OpenSearch. Aceasta va servi drept baza de date vectorială pentru stocarea și preluarea încorporării.
2. Configurați rolurile IAM: creați roluri IAM pentru a gestiona permisiunile între OpenSearch și Sagemaker. Aceasta include roluri pentru invocarea modelului de sagemaker și pentru utilizatorul dvs. să creeze conectori.

Pasul 3: Configurați rolurile și permisiunile IAM

1. Crearea rolului IAM pentru accesul la sagemaker: Acest rol permite OpenSearch să invoce modelul Deepseek pe Sagemaker. Atașați politicile necesare pentru a activa invocarea modelului.
2. Configurați rolul IAM în OpenSearch: Asigurați -vă că OpenSearch are permisiunile necesare pentru a interacționa cu modelele de sagemaker.

Pasul 4: Creare conector OpenSearch

1. Utilizați scripturi pentru a crea conector: utilizați scripturi Python furnizate pentru a crea un conector OpenSearch la SageMaker. Acest conector permite OpenSearch să apeleze la modelul Deepseek pentru generarea de text.
2. Înregistrați modelul: utilizați API -ul OpenSearch pentru a înregistra modelul Deepseek. Aceasta implică specificarea numelui modelului, a tipului de funcții și a ID -ului conectorului.

Pasul 5: Implementați fluxul de lucru Rag

1. Utilizați încorporarea vectorială pentru căutare: Configurați OpenSearch pentru a utiliza Embeddings Vector pentru căutarea semantică. Aceasta permite o regăsire mai precisă a documentelor relevante.
2. Integrați -vă cu Deepseek pentru generarea de text: Odată ce documentele relevante sunt preluate, utilizați modelul Deepseek pentru a genera răspunsuri la text pe baza informațiilor preluate.

Pasul 6: Testați și implementați

1. Testați sistemul RAG: utilizați o interogare de probă pentru a testa capacitatea sistemului de a prelua documente relevante și de a genera răspunsuri text coerente.
2. Implementați aplicația: Odată testat, implementați aplicația RAG pentru utilizarea producției, asigurându -vă că toate componentele sunt securizate și configurate corespunzător.

Această configurație folosește capabilitățile de raționament ale Deepseek și caracteristicile bazei de date vectoriale OpenSearch pentru a crea un flux de lucru robust Rag pe AWS. Pentru instrucțiuni și scripturi mai detaliate, consultați documentația AWS și depozitele Github legate de Deepseek și OpenSearch [1] [2] [6].

Citări:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
]
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek--bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666