AWS'de Deepseek ile Geri Artırılmış Artırılmış Nesil (RAG) iş akışı ayarlama

AWS'de Deepseek ile Alma Artırılmış Nesil (RAG) iş akışı nasıl kurarım

AWS'de DeepSeek ile Alma Artırılmış Nesil (RAG) iş akışı kurmak, öncelikle Amazon Sagemaker ve Amazon Opensearch hizmetini kullanan birkaç adım içerir. İşte bunun nasıl uygulanacağına dair ayrıntılı bir rehber:

Adım 1: Amazon Sagemaker'a Deepseek-R1'i dağıtın

1. Bir Sagemaker Etki Alanı Oluştur: Amazon Sagemaker'a gidin ve yeni bir etki alanı oluşturun. "Tek Kullanıcı Hızlı Kurulumu" seçeneğini seçin ve kurulumun tamamlanmasını bekleyin.
2. Deepseek-R1 Modelini Dağıtın: Etki alanınız hazır olduğunda, Sagemaker Studio'yu açın ve Deepseek-R1 modelini dağıtın. Bu adım, model için bir uç nokta oluşturmayı içerir.

Adım 2: Amazon Opensearch Hizmetini Kurun

1. Bir Opensearch Alan Alanı Oluştur: AWS konsoluna gidin ve yeni bir Opensearch alanı oluşturun. Bu, gömlekleri depolamak ve almak için vektör veritabanınız olarak hizmet edecektir.
2. Rolleri yapılandırın: Opensearch ve sagemaker arasındaki izinleri yönetmek için IAM rolleri oluşturun. Bu, Sagemaker modelini çağırmak ve kullanıcınızın konektörler oluşturması için rolleri içerir.

Adım 3: IAM rollerini ve izinleri yapılandırın

1. Sagemaker Erişim için IAM rolü oluşturun: Bu rol, OpenSearch'in Sagemaker'daki Deepseek modelini çağırmasına izin verir. Model çağrısını etkinleştirmek için gerekli politikaları ekleyin.
2. Opensearch'te IAM rolünü yapılandırın: OpenSearch'in Sagemaker modelleriyle etkileşim kurmak için gerekli izinlere sahip olduğundan emin olun.

Adım 4: Opensearch Connector Oluştur

1. Konnektör oluşturmak için komut dosyalarını kullanın: Sagemaker'a bir Opensearch konnektörü oluşturmak için sağlanan Python komut dosyalarını kullanın. Bu konektör, Opensear'ın metin oluşturma için Deepseek modelini çağırmasını sağlar.
2. Modeli kaydedin: Deepseek modelini kaydetmek için Opensearch API'sını kullanın. Bu, model adını, işlev türünü ve konektör kimliğini belirtmeyi içerir.

Adım 5: RAG iş akışını uygulayın

1 Arama için vektör gömme kullanın: Semantik arama için vektör gömme kullanımı kullanacak şekilde Opensearch. Bu, ilgili belgelerin daha doğru bir şekilde alınmasını sağlar.
2. Metin oluşturma için Deepseek ile entegre: İlgili belgeler alındıktan sonra, alınan bilgilere dayalı metin yanıtları oluşturmak için Deepseek modelini kullanın.

Adım 6: Test ve Dağıtım

1. RAG sistemini test edin: Sistemin ilgili belgeleri alma ve tutarlı metin yanıtları oluşturma yeteneğini test etmek için örnek bir sorgu kullanın.
2. Uygulamayı dağıtın: Test edildikten sonra, tüm bileşenlerin uygun şekilde sabitlenmesini ve yapılandırılmasını sağlayarak üretim kullanımı için RAG uygulamasını dağıtın.

Bu kurulum, AWS'de sağlam bir bez iş akışı oluşturmak için Deepseek'in akıl yürütme yeteneklerini ve OpenSearch'in vektör veritabanı özelliklerinden yararlanır. Daha ayrıntılı talimatlar ve komut dosyaları için, Deepseek ve Opensearch [1] [2] [6] ile ilgili AWS belgelerine ve GitHub depolarına bakın.

Alıntılar:
[1] https://www.youtube.com/watch?v=k2bse_hwl78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database ve-samazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_jxeixvuvnw
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c36468666