Iestatot iegūto paplašinātās paaudzes (RAG) darbplūsmu ar DeepSeek on AWS, ir vairākas darbības, galvenokārt izmantojot Amazon Sagemaker un Amazon OpenSearch Service. Šeit ir detalizēts ceļvedis par to, kā to ieviest:
1. solis: izvietojiet DeepSeek-R1 Amazon Sagemaker
1. Izveidojiet Sagemaker domēnu: dodieties uz Amazon Sagemaker un izveidojiet jaunu domēnu. Izvēlieties opciju "Vienreizējs lietotāja ātrā iestatīšana" un gaidiet, līdz iestatīšana tiks pabeigta.
2. Izvietojiet DeepSeek-R1 modeli: Kad jūsu domēns ir gatavs, atveriet Sagemaker Studio un izvietojiet DeepSeek-R1 modeli. Šis solis ietver modeļa galapunkta iestatīšanu.
2. solis: iestatiet Amazon OpenSearch Service
1. Izveidojiet OpenSearch domēnu: dodieties uz AWS konsoli un izveidojiet jaunu OpenSearch domēnu. Tas kalpos kā jūsu vektora datu bāze iegulšanas glabāšanai un iegūšanai.
2. Konfigurējiet IAM lomas: izveidojiet IAM lomas, lai pārvaldītu atļaujas starp Opensearch un Sagemaker. Tas ietver lomas, lai izsauktu Sagemaker modeli un jūsu lietotājam, lai izveidotu savienotājus.
3. solis: konfigurējiet IAM lomas un atļaujas
1. Izveidojiet IAM lomu Sagemaker Access: Šī loma ļauj OpenSearch izmantot DeepSeek modeli Sagemaker. Pievienojiet nepieciešamās politikas, lai iespējotu modeļa piesaukšanu.
2. Konfigurējiet IAM lomu OpenSearch: pārliecinieties, ka OpenSearch ir nepieciešamās atļaujas, lai mijiedarbotos ar Sagemaker modeļiem.
4. solis: izveidojiet OpenSearch savienotāju
1. Izmantojiet skriptus, lai izveidotu savienotāju: izmantojiet sniegtos Python skriptus, lai izveidotu OpenSearch savienotāju Sagemaker. Šis savienotājs ļauj OpenSearch saukt DeepSeek modeli teksta ģenerēšanai.
2. Reģistrējieties modelim: izmantojiet OpenSearch API, lai reģistrētu DeepSeek modeli. Tas ietver modeļa nosaukuma, funkcijas veida un savienotāja ID norādīšanu.
5. solis: ieviesiet lupatu darbplūsmu
1. Izmantojiet vektoru iegulumus meklēšanai: konfigurējiet OpenSearch, lai semantiskai meklēšanai izmantotu vektoru iegulumus. Tas ļauj precīzāk iegūt attiecīgos dokumentus.
2. Integrēt ar DeepSeek teksta ģenerēšanai: Kad ir izgūti attiecīgie dokumenti, izmantojiet DeepSeek modeli, lai ģenerētu teksta atbildes, pamatojoties uz iegūto informāciju.
6. solis: pārbaude un izvietošana
1. Pārbaudiet lupatu sistēmu: izmantojiet parauga vaicājumu, lai pārbaudītu sistēmas spēju iegūt attiecīgos dokumentus un ģenerēt saskaņotas teksta atbildes.
2. Izvietojiet lietojumprogrammu: pēc pārbaudes izvietojiet lupatu lietojumprogrammu ražošanas lietošanai, nodrošinot, ka visi komponenti ir pareizi nostiprināti un konfigurēti.
Šī iestatīšana izmanto DeepSeek spriešanas iespējas un OpenSearch vektora datu bāzes funkcijas, lai izveidotu spēcīgu lupatu darbplūsmu AWS. Sīkākus norādījumus un skriptus skatiet AWS dokumentācijā un GitHub krātuvēs, kas saistītas ar DeepSeek un OpenSearch [1] [2] [6].
Atsauces:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-depseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixVuvnw
[6.]
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-depseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666