Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Kuinka voin perustaa haku lisätyn sukupolven (RAG) työnkulun Deepseekillä AWS


Kuinka voin perustaa haku lisätyn sukupolven (RAG) työnkulun Deepseekillä AWS


Hakuvalvotun sukupolven (RAG) työnkulun perustaminen Deepseekillä AWS: llä sisältää useita vaiheita, pääasiassa Amazon Sagemakerin ja Amazon OpenSearch -palvelun avulla. Tässä on yksityiskohtainen opas tämän toteuttamiseksi:

Vaihe 1: Ota Deepseek-R1 käyttöön Amazon Sagemakerissa

1. Luo Sagemaker -verkkotunnus: Siirry Amazon Sagemakeriin ja luo uusi verkkotunnus. Valitse "Yhden käyttäjän Quick Settup" -vaihtoehto ja odota, että asetukset suoritetaan.
2. Asenna Deepseek-R1-malli: Kun verkkotunnuksesi on valmis, avoin Sagemaker-studio ja asenna Deepseek-R1-malli. Tämä vaihe sisältää mallin päätepisteen asettamisen.

Vaihe 2: Aseta Amazon OpenSearch Service

1. Luo openssearvon verkkotunnus: Siirry AWS -konsoliin ja luo uusi OpenSearch -verkkotunnus. Tämä toimii vektoritietokantana upotusten tallentamisessa ja hakemisessa.
2. Määritä IAM -roolit: Luo IAM -roolit hallitaksesi käyttöoikeuksia OpenSearchin ja Sagemakerin välillä. Tämä sisältää roolit Sagemaker -mallin ja käyttäjän luomiseen liittimien luomiseen.

Vaihe 3: Määritä IAM -roolit ja käyttöoikeudet

1. Luo IAM -rooli Sagemaker Access -sovellukselle: Tämä rooli antaa OpenSearchin vedota Deepseek -malliin Sagemakeriin. Liitä tarvittavat käytännöt mallin kutsun mahdollistamiseksi.
2. Määritä IAM -rooli OpenSearchissa: Varmista, että OpenSearchilla on tarvittavat käyttöoikeudet olla vuorovaikutuksessa Sagemaker -mallien kanssa.

Vaihe 4: Luo OpenSearch Connector

1. Luo Connector: Hyödynnä toimitettuja Python -skriptejä opensearch -liittimen luomiseen Sagemakeriin. Tämä liitin mahdollistaa OpenSearchin kutsua Deepseek -mallia tekstin luomiseen.
2. Rekisteröi malli: Rekisteröi DeepSeek -malli OpenSearch -sovellusliittymällä. Tähän sisältyy mallinimen, toimintotyypin ja liittimen tunnuksen määrittäminen.

Vaihe 5: Toteuta RAG -työnkulku

1. Käytä Vector EpäbedDingsia hakuun: Määritä OpenSearch käyttämään vektorisammioita semanttiseen hakuun. Tämä mahdollistaa asiaankuuluvien asiakirjojen tarkemman hakemisen.
2. Integroitu Deepseekiin tekstin luomiseen: Kun asiaankuuluvat asiakirjat on haettu, luodaan DeepSeek -mallia tekstitietojen perusteella.

Vaihe 6: Testaa ja ota käyttöön

1. Testaa RAG -järjestelmä: Käytä näytekyselyä testataksesi järjestelmän kyky hakea asiaankuuluvat asiakirjat ja luoda johdonmukaisia ​​tekstivasteita.
2. Asenna sovellus: Kun testataan, asenna RAG -sovellus tuotantokäyttöön varmistaen, että kaikki komponentit on oikein kiinnitetty ja konfiguroitu.

Tämä asennus hyödyntää Deepseekin päättelymahdollisuuksia ja OpenSearchin vektoritietokantaominaisuuksia luomaan vankka rag -työnkulku AWS: llä. Katso yksityiskohtaisempia ohjeita ja skriptejä AWS -dokumentaatiosta ja GitHub -arkistoista, jotka liittyvät Deepseekiin ja openssearchiin [1] [2] [6].

Viittaukset:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
.
.
[4] https://github.com/spidy20/deeptseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
.
.
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36466666