Ustanowienie przepływu pracy powiększonego pokolenia (RAG) z Deepseek na AWS

Jak skonfigurować przepływ pracy powiększonego pokolenia (RAG) z Deepseek na AWS

Konfigurowanie przepływu pracy w zakresie generacji rozszerzonej (RAG) z DeepSeek on AWS obejmuje kilka kroków, głównie przy użyciu Amazon Sagemaker i Amazon OpenSearch Service. Oto szczegółowy przewodnik, jak to wdrożyć:

Krok 1: Wdrożenie Deepseek-R1 na Amazon Sagemaker

1. Utwórz domenę Sagemaker: Przejdź do Amazon Sagemaker i utwórz nową domenę. Wybierz opcję „Szybki konfigurację użytkownika pojedynczego użytkownika” i poczekaj na zakończenie konfiguracji.
2. Model wdrażania DeepSeek-R1: Gdy domena będzie gotowa, otwórz studio Sagemaker i wdrożyć model DeepSeek-R1. Ten krok obejmuje ustalenie punktu końcowego dla modelu.

Krok 2: Skonfiguruj usługę Amazon OpenSearch

1. Utwórz domenę OpenSearch: Przejdź do konsoli AWS i utwórz nową domenę OpenSearch. Będzie to służyć jako baza danych wektorowych do przechowywania i pobierania osadzania.
2. Konfiguruj Role IAM: Utwórz role IAM, aby zarządzać uprawnieniami między OpenSearch i Sagemaker. Obejmuje to role wywołania modelu SageMaker i dla użytkownika do tworzenia złączy.

Krok 3: Skonfiguruj role IAM i uprawnienia

1. Stwórz rolę IAM dla Sagemaker Access: Ta rola pozwala OpenSearch wywołać model Deepseek na SageMaker. Dołącz niezbędne zasady, aby umożliwić wywołanie modelu.
2. Skonfiguruj rolę IAM w OpenSearch: Upewnij się, że OpenSearch ma niezbędne uprawnienia do interakcji z modelami SageMaker.

Krok 4: Utwórz złącze OpenSearch

1. Użyj scenariuszy do utworzenia złącza: Użyj dostarczonych skryptów Python, aby utworzyć złącze OpenSearch dla SageMaker. To złącze umożliwia OpenSearch wywołanie modelu DeepSeek do generowania tekstu.
2. Zarejestruj model: Użyj interfejsu API OpenSearch, aby zarejestrować model Deepseek. Obejmuje to określenie nazwy modelu, typu funkcji i identyfikatora złącza.

Krok 5: Wdrożenie przepływu pracy Rag

1. Użyj osadzania wektora do wyszukiwania: Skonfiguruj OpenSearch, aby używać osadzania wektorów do wyszukiwania semantycznego. Pozwala to na dokładniejsze pobieranie odpowiednich dokumentów.
2. Zintegruj z DeepSeek w celu generowania tekstu: Po pobraniu odpowiednich dokumentów użyj modelu DeepSeek, aby wygenerować odpowiedzi tekstowe na podstawie pobranych informacji.

Krok 6: Testuj i wdrażaj

1. Przetestuj system RAG: Użyj zapytania, aby przetestować zdolność systemu do pobierania odpowiednich dokumentów i generowania spójnych odpowiedzi tekstowych.
2. Wdrażaj aplikację: Po przetestowaniu wdrożenie aplikacji RAG do użytku produkcyjnego, upewniając się, że wszystkie komponenty są odpowiednio zabezpieczone i skonfigurowane.

Ta konfiguracja wykorzystuje funkcje rozumowania DeepSeek i funkcje bazy danych Vector OPENSEARCH, aby stworzyć solidny przepływ pracy na AWS. Bardziej szczegółowe instrukcje i skrypty można znaleźć w dokumentacji AWS i repozytoriach GitHub związanych z DeepSeek i OpenSearch [1] [2] [6].

Cytaty:
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-ervice-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tuorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-ag-app-app
[5] https://www.youtube.com/watch?v=_JXEIXVUVNW
[6] https://opensearch.org/docs/latest/vector-search/Tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/Tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666