Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Hogyan állíthatok be egy visszakeresési kibővített generációs (rag) munkafolyamatot a DeepSeek -rel az AWS -en


Hogyan állíthatok be egy visszakeresési kibővített generációs (rag) munkafolyamatot a DeepSeek -rel az AWS -en


A visszakeresési kibővített generációs (RAG) munkafolyamat beállítása a DeepSeek -rel az AWS -en több lépést foglal magában, elsősorban az Amazon Sagemaker és az Amazon OpenSearch Service használatával. Itt található egy részletes útmutató ennek megvalósításához:

1. lépés: Telepítse a DeepSeek-R1-et az Amazon Sagemaker-en

1. Hozzon létre egy Sagemaker domaint: keresse meg az Amazon Sagemaker -t, és hozzon létre egy új domaint. Válassza ki az "Egy felhasználó gyors beállítása" lehetőséget, és várja meg a beállítás befejezését.
2. telepítés DeepSeek-R1 modell: Miután készen áll a domain, nyissa meg a Sagemaker Studio-t, és telepítse a DeepSeek-R1 modellt. Ez a lépés magában foglalja a modell végpontjának beállítását.

2. lépés: Állítsa be az Amazon Opensearch Service szolgáltatást

1. Hozzon létre egy OpenSearch tartományt: Menjen az AWS konzolra, és hozzon létre egy új OpenSearch tartományt. Ez a vektor adatbázisként szolgál a beágyazások tárolására és letöltésére.
2. Konfigurálja az IAM szerepeket: Hozzon létre IAM szerepeket az OpenSearch és a Sagemaker közötti engedélyek kezelésére. Ez magában foglalja a Sagemaker modell meghívásának szerepét, valamint a felhasználó létrehozásához a csatlakozók létrehozását.

3. lépés: Konfigurálja az IAM szerepeket és engedélyeket

1. Hozzon létre IAM szerepet a Sagemaker hozzáféréshez: Ez a szerep lehetővé teszi az OpenSearch számára, hogy meghívja a Sagemaker DeepSeek modelljét. Csatlakoztassa a szükséges irányelveket a modellhívás engedélyezéséhez.
2. Konfigurálja az IAM szerepét az OpenSearch -ben: Győződjön meg arról, hogy az OpenSearch rendelkezik -e a Sagemaker modellekkel való interakcióhoz szükséges engedélyekkel.

4. lépés: Hozzon létre OpenSearch csatlakozót

1. Használjon szkripteket csatlakozó létrehozásához: Használja a biztosított Python szkripteket az OpenSearch csatlakozó létrehozásához a Sagemakerhez. Ez a csatlakozó lehetővé teszi az OpenSearch számára, hogy felhívja a Mélyszövés modellt a szöveggenerálásra.
2. Regisztrálja a modellt: használja az Opensearch API -t a DeepSeek modell regisztrálásához. Ez magában foglalja a modellnév, a funkció típus és a csatlakozó azonosítójának meghatározását.

5. lépés: Végezze el a rongy munkafolyamatot

1. Használja a vektor beágyazást a kereséshez: Konfigurálja az OpenSearch -t a vektor beágyazás használatához a szemantikai kereséshez. Ez lehetővé teszi a releváns dokumentumok pontosabb lekérdezését.
2. Integráljon a DeepSeek -hez a szöveggeneráláshoz: A releváns dokumentumok visszakeresése után használja a DeepSeek modellt a szöveges válaszok generálásához a visszakeresett információk alapján.

6. lépés: Tesztelje és telepítse

1. Tesztelje a RAG rendszert: Használjon minta lekérdezést a rendszer képességének tesztelésére a releváns dokumentumok visszakeresésére és koherens szöveges válaszok generálására.
2. Telepítse az alkalmazást: A tesztelés után telepítse a RAG -alkalmazást termelés használatára, biztosítva, hogy az összes alkatrész megfelelően rögzítve és konfigurálva legyen.

Ez a beállítás kihasználja a DeepSeek érvelési képességeit és az OpenSearch Vector Database funkcióit, hogy robusztus rongy munkafolyamatot hozzon létre az AWS -en. A részletesebb utasításokat és szkripteket a DeepSeek és az Opensearch [1] [2] [6] -val kapcsolatos AWS dokumentáció és GitHub adattárak találhatók.

Idézetek:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-etector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxEixVuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194E24B-49C8-F3C1-2748-3B9C36468666