Hakutetun sukupolven (RAG) työnkulun perustaminen Deepseekillä AWS: llä

Kuinka voin perustaa haku lisätyn sukupolven (RAG) työnkulun Deepseekillä AWS

Hakuvalvotun sukupolven (RAG) työnkulun perustaminen Deepseekillä AWS: llä sisältää useita vaiheita, pääasiassa Amazon Sagemakerin ja Amazon OpenSearch -palvelun avulla. Tässä on yksityiskohtainen opas tämän toteuttamiseksi:

Vaihe 1: Ota Deepseek-R1 käyttöön Amazon Sagemakerissa

1. Luo Sagemaker -verkkotunnus: Siirry Amazon Sagemakeriin ja luo uusi verkkotunnus. Valitse "Yhden käyttäjän Quick Settup" -vaihtoehto ja odota, että asetukset suoritetaan.
2. Asenna Deepseek-R1-malli: Kun verkkotunnuksesi on valmis, avoin Sagemaker-studio ja asenna Deepseek-R1-malli. Tämä vaihe sisältää mallin päätepisteen asettamisen.

Vaihe 2: Aseta Amazon OpenSearch Service

1. Luo openssearvon verkkotunnus: Siirry AWS -konsoliin ja luo uusi OpenSearch -verkkotunnus. Tämä toimii vektoritietokantana upotusten tallentamisessa ja hakemisessa.
2. Määritä IAM -roolit: Luo IAM -roolit hallitaksesi käyttöoikeuksia OpenSearchin ja Sagemakerin välillä. Tämä sisältää roolit Sagemaker -mallin ja käyttäjän luomiseen liittimien luomiseen.

Vaihe 3: Määritä IAM -roolit ja käyttöoikeudet

1. Luo IAM -rooli Sagemaker Access -sovellukselle: Tämä rooli antaa OpenSearchin vedota Deepseek -malliin Sagemakeriin. Liitä tarvittavat käytännöt mallin kutsun mahdollistamiseksi.
2. Määritä IAM -rooli OpenSearchissa: Varmista, että OpenSearchilla on tarvittavat käyttöoikeudet olla vuorovaikutuksessa Sagemaker -mallien kanssa.

Vaihe 4: Luo OpenSearch Connector

1. Luo Connector: Hyödynnä toimitettuja Python -skriptejä opensearch -liittimen luomiseen Sagemakeriin. Tämä liitin mahdollistaa OpenSearchin kutsua Deepseek -mallia tekstin luomiseen.
2. Rekisteröi malli: Rekisteröi DeepSeek -malli OpenSearch -sovellusliittymällä. Tähän sisältyy mallinimen, toimintotyypin ja liittimen tunnuksen määrittäminen.

Vaihe 5: Toteuta RAG -työnkulku

1. Käytä Vector EpäbedDingsia hakuun: Määritä OpenSearch käyttämään vektorisammioita semanttiseen hakuun. Tämä mahdollistaa asiaankuuluvien asiakirjojen tarkemman hakemisen.
2. Integroitu Deepseekiin tekstin luomiseen: Kun asiaankuuluvat asiakirjat on haettu, luodaan DeepSeek -mallia tekstitietojen perusteella.

Vaihe 6: Testaa ja ota käyttöön

1. Testaa RAG -järjestelmä: Käytä näytekyselyä testataksesi järjestelmän kyky hakea asiaankuuluvat asiakirjat ja luoda johdonmukaisia tekstivasteita.
2. Asenna sovellus: Kun testataan, asenna RAG -sovellus tuotantokäyttöön varmistaen, että kaikki komponentit on oikein kiinnitetty ja konfiguroitu.

Tämä asennus hyödyntää Deepseekin päättelymahdollisuuksia ja OpenSearchin vektoritietokantaominaisuuksia luomaan vankka rag -työnkulku AWS: llä. Katso yksityiskohtaisempia ohjeita ja skriptejä AWS -dokumentaatiosta ja GitHub -arkistoista, jotka liittyvät Deepseekiin ja openssearchiin [1] [2] [6].

Viittaukset:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
.
.
[4] https://github.com/spidy20/deeptseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
.
.
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36466666