Õppinud põlvkonna (RAG) töövoogude loomine koos DeepSEEK -iga AWS -il

Kuidas seadistada väljavõtmise suurendatud põlvkonna (RAG) töövoogu koos Deepseekiga AWS -il

Otsimise suurendatud genereerimise (RAG) töövoo loomine koos DeepSEEK -iga AWS -iga hõlmab mitut sammu, kasutades peamiselt Amazon Sagemaker ja Amazon Opensearch Service. Siin on üksikasjalik juhend selle rakendamiseks:

1. samm: DeepSEEK-R1 juurutamine Amazon Sagemakeris

1. Looge AGEMakeri domeen: liikuge Amazon Sagemakerisse ja looge uus domeen. Valige suvand "Üksiku kasutaja kiire seadistus" ja oodake seadistuse lõpuleviimist.
2. Deepseek-R1 mudel: kui teie domeen on valmis, Open SageMakeri stuudio ja juurutage DeepSEEK-R1 mudel. See samm hõlmab mudeli lõpp -punkti seadistamist.

2. samm: seadistage Amazon OpenSearch Service

1. Looge OpenSearchi domeen: minge AWS -i konsooli ja looge uus OpenSearchi domeen. See toimib teie vektori andmebaasina manustamiste salvestamiseks ja hankimiseks.
2. See hõlmab rolle SageMakeri mudeli kutsumiseks ja teie kasutaja pistikute loomiseks.

3. samm: IAM -i rollide ja lubade konfigureerimine

1. Looge IAM -i roll SageMakeri juurdepääsuks: see roll võimaldab OpenSearchil kutsuda Deepseeki mudelit SageMakerile. Kinnitage mudeli kutsumise võimaldamiseks vajalikud poliitikad.
2. IAM -i rolli konfigureerimine OpenSearchis: veenduge, et OpenSearchil oleks vajalikud õigused SageMakeri mudelitega suhtlemiseks.

4. samm: looge OpenSearchi pistik

1. Pistiku loomiseks kasutage skripte: kasutage Pythoni skripte, et luua SageMakerile OpenSearchi pistik. See pistik võimaldab OpenSearchil helistada teksti genereerimiseks DeepSEEK -i mudelile.
2. Registreeri mudel: DeepSEEK -mudeli registreerimiseks kasutage OpenSearch API -d. See hõlmab mudeli nime, funktsiooni tüübi ja pistiku ID määramist.

5. samm: rakendage Rag Workflow

1. Kasutage otsinguks vektormanuseid: konfigureerige OpenSearch, et kasutada semantiliseks otsinguks vektori manustamiseks. See võimaldab asjakohaste dokumentide täpsemat hankimist.
2. integreeruge teksti genereerimiseks DeepSEEK -ga: kui asjakohased dokumendid on hangitud, kasutage teksti vastuste genereerimiseks DeepSEEK -i mudelit.

6. samm: testimine ja juurutamine

1. Testige kaltssüsteemi: kasutage proovipäringut, et testida süsteemi võimet hankida asjakohaseid dokumente ja genereerida sidusaid tekstivastusi.
2. Juurutage rakendus: kui testitakse, juurutage rakendus RAG tootmiseks, tagades, et kõik komponendid on korralikult kinnitatud ja konfigureeritud.

See seadistamine kasutab Deepseeki mõttekäikude võimalusi ja OpenSearchi vektor -andmebaasi funktsioone, et luua AWS -i tugev kalts -töövoog. Üksikasjalikumate juhiste ja skriptide leiate AWS -i dokumentatsioonist ja GitHubi hoidlatest, mis on seotud Deepseeki ja OpenSearchiga [1] [2] [6].

Tsitaadid:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
]
]
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixVuvnw
]
]
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666