Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Πώς μπορώ να δημιουργήσω μια ροή εργασίας για την ανάκτηση της γενιάς (RAG) με το Deepseek στο AWS


Πώς μπορώ να δημιουργήσω μια ροή εργασίας για την ανάκτηση της γενιάς (RAG) με το Deepseek στο AWS


Η δημιουργία μιας ροής εργασίας για την ανάκτηση της Augmented Generation (RAG) με το Deepseek στο AWS περιλαμβάνει διάφορα βήματα, χρησιμοποιώντας κυρίως την υπηρεσία Amazon Sagemaker και Amazon OpenSearch. Ακολουθεί ένας λεπτομερής οδηγός για τον τρόπο εφαρμογής αυτού:

Βήμα 1: Ανάπτυξη DeepSeeek-R1 στο Amazon Sagemaker

1. Δημιουργήστε έναν τομέα Sagemaker: Μεταβείτε στο Amazon Sagemaker και δημιουργήστε ένα νέο τομέα. Επιλέξτε την επιλογή "Single User Quick Setup" και περιμένετε να ολοκληρωθεί η ρύθμιση.
2. Αναπτύξτε το μοντέλο DeepSeeek-R1: Μόλις ο τομέας σας είναι έτοιμος, ανοίξτε το Sagemaker Studio και αναπτύξτε το μοντέλο DeepSeeek-R1. Αυτό το βήμα περιλαμβάνει τη δημιουργία ενός τελικού σημείου για το μοντέλο.

Βήμα 2: Ρυθμίστε την υπηρεσία OpenSearch Amazon

1. Δημιουργήστε έναν τομέα OpenSearch: Μεταβείτε στην κονσόλα AWS και δημιουργήστε ένα νέο τομέα OpenSearch. Αυτό θα χρησιμεύσει ως βάση δεδομένων των φορέων για την αποθήκευση και την ανάκτηση των ενσωματωμάτων.
2. Ρύθμιση των ρόλων IAM: Δημιουργήστε ρόλους IAM για να διαχειριστείτε τα δικαιώματα μεταξύ Openearch και Sagemaker. Αυτό περιλαμβάνει ρόλους για την επίκληση του μοντέλου Sagemaker και για τον χρήστη σας να δημιουργήσει συνδετήρες.

Βήμα 3: Διαμορφώστε τους ρόλους και τα δικαιώματα IAM

1. Δημιουργία ρόλου IAM για το Sagemaker Access: Αυτός ο ρόλος επιτρέπει στο OpenSearch να επικαλείται το μοντέλο Deepseek στο Sagemaker. Επισυνάψτε τις απαραίτητες πολιτικές για να ενεργοποιήσετε την επίκληση του μοντέλου.
2. Ρύθμιση του ρόλου IAM στο OpenSearch: Βεβαιωθείτε ότι η OpenSearch έχει τα απαραίτητα δικαιώματα να αλληλεπιδράσει με τα μοντέλα Sagemaker.

Βήμα 4: Δημιουργία σύνδεσης OpenSearch

1. Χρησιμοποιήστε τα σενάρια για να δημιουργήσετε το σύνδεσμο: Χρησιμοποιήστε τα παρέχονται σενάρια Python για να δημιουργήσετε ένα σύνδεσμο Openearch στο Sagemaker. Αυτός ο σύνδεσμος επιτρέπει στο OpenSearch να καλέσει το μοντέλο Deepseek για την παραγωγή κειμένου.
2. Καταχωρίστε το μοντέλο: Χρησιμοποιήστε το API OpenEarch για να καταχωρήσετε το μοντέλο DeepSeeek. Αυτό περιλαμβάνει τον προσδιορισμό του ονόματος του μοντέλου, του τύπου λειτουργίας και του αναγνωριστικού σύνδεσης.

Βήμα 5: Εφαρμογή ροής εργασίας RAG

1. Χρησιμοποιήστε τις ενσωματωμένες διανυσματικές ενσωματωμένες για αναζήτηση: Διαμορφώστε το OpenESHARE για να χρησιμοποιήσετε ενσωματωμένες ενσωματωμένες διανυσματικές για σημασιολογική αναζήτηση. Αυτό επιτρέπει την ακριβέστερη ανάκτηση των σχετικών εγγράφων.
2. Ενσωματώστε με το Deepseek για την παραγωγή κειμένου: Μόλις ανακτηθούν σχετικά έγγραφα, χρησιμοποιήστε το μοντέλο DeepSeek για να δημιουργήσετε απαντήσεις κειμένου με βάση τις ανακτηθέντες πληροφορίες.

Βήμα 6: Δοκιμή και ανάπτυξη

1. Ελέγξτε το σύστημα RAG: Χρησιμοποιήστε ένα ερώτημα δείγματος για να ελέγξετε την ικανότητα του συστήματος να ανακτήσετε τα σχετικά έγγραφα και να δημιουργήσετε συνεκτικές απαντήσεις κειμένου.
2. Αναπτύξτε την εφαρμογή: Μόλις δοκιμαστεί, αναπτύξτε την εφαρμογή RAG για χρήση παραγωγής, εξασφαλίζοντας ότι όλα τα εξαρτήματα είναι σωστά ασφαλισμένα και διαμορφωμένα.

Αυτή η ρύθμιση αξιοποιεί τις δυνατότητες συλλογιστικής του DeepSeeek και τις δυνατότητες βάσης δεδομένων της OpenSearch για να δημιουργήσει μια ισχυρή ροή εργασίας για το AWS. Για πιο λεπτομερείς οδηγίες και σενάρια, ανατρέξτε στα αποθετήρια τεκμηρίωσης AWS και GitHub που σχετίζονται με το DeepSeek και το OpenESHARE [1] [2] [6].

Αναφορές:
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666