การตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) การดึงข้อมูลด้วย Deepseek บน AWS

การตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) การดึงข้อมูลด้วย Deepseek บน AWS นั้นเกี่ยวข้องกับหลายขั้นตอนโดยใช้ Amazon Sagemaker และ Amazon OpenSearch Service นี่คือคำแนะนำโดยละเอียดเกี่ยวกับวิธีการใช้งานนี้:

ขั้นตอนที่ 1: ปรับใช้ Deepseek-R1 ใน Amazon Sagemaker

1. สร้างโดเมน Sagemaker: นำทางไปยัง Amazon Sagemaker และสร้างโดเมนใหม่ เลือกตัวเลือก "การตั้งค่าอย่างรวดเร็วของผู้ใช้เดี่ยว" และรอให้การตั้งค่าเสร็จสมบูรณ์
2. ปรับใช้โมเดล Deepseek-R1: เมื่อโดเมนของคุณพร้อมให้เปิดสตูดิโอ Sagemaker และปรับใช้โมเดล Deepseek-R1 ขั้นตอนนี้เกี่ยวข้องกับการตั้งค่าจุดสิ้นสุดสำหรับโมเดล

ขั้นตอนที่ 2: ตั้งค่าบริการ OpenSearch Amazon

1. สร้างโดเมน OpenSearch: ไปที่คอนโซล AWS และสร้างโดเมน OpenSearch ใหม่ สิ่งนี้จะทำหน้าที่เป็นฐานข้อมูลเวกเตอร์ของคุณสำหรับการจัดเก็บและดึงการฝังตัว
2. กำหนดค่าบทบาทของ IAM: สร้างบทบาทของ IAM เพื่อจัดการการอนุญาตระหว่าง OpenSearch และ Sagemaker ซึ่งรวมถึงบทบาทสำหรับการเรียกใช้โมเดล Sagemaker และสำหรับผู้ใช้ของคุณในการสร้างตัวเชื่อมต่อ

ขั้นตอนที่ 3: กำหนดค่าบทบาทและการอนุญาตของ IAM

1. สร้างบทบาท IAM สำหรับการเข้าถึง Sagemaker: บทบาทนี้ช่วยให้ OpenSearch เรียกใช้โมเดล Deepseek บน Sagemaker แนบนโยบายที่จำเป็นเพื่อเปิดใช้งานการเรียกใช้แบบจำลอง
2. กำหนดค่าบทบาทของ IAM ใน OpenSearch: ตรวจสอบให้แน่ใจว่า OpenSearch มีสิทธิ์ที่จำเป็นในการโต้ตอบกับโมเดล Sagemaker

ขั้นตอนที่ 4: สร้างตัวเชื่อมต่อ OpenSearch

1. ใช้สคริปต์เพื่อสร้างตัวเชื่อมต่อ: ใช้สคริปต์ Python ที่ให้ไว้เพื่อสร้างตัวเชื่อมต่อ OpenSearch ไปยัง Sagemaker ตัวเชื่อมต่อนี้ช่วยให้ OpenSearch เรียกรุ่น Deepseek สำหรับการสร้างข้อความ
2. ลงทะเบียนรุ่น: ใช้ OpenSearch API เพื่อลงทะเบียนรุ่น Deepseek สิ่งนี้เกี่ยวข้องกับการระบุชื่อโมเดลประเภทฟังก์ชันและ ID ตัวเชื่อมต่อ

ขั้นตอนที่ 5: ใช้เวิร์กโฟลว์ RAG

1. ใช้การฝังเวกเตอร์สำหรับการค้นหา: กำหนดค่า OpenSearch เพื่อใช้การฝังเวกเตอร์สำหรับการค้นหาความหมาย สิ่งนี้ช่วยให้การดึงเอกสารที่เกี่ยวข้องถูกต้องมากขึ้น
2. รวมเข้ากับ Deepseek สำหรับการสร้างข้อความ: เมื่อเรียกคืนเอกสารที่เกี่ยวข้องให้ใช้โมเดล Deepseek เพื่อสร้างการตอบสนองข้อความตามข้อมูลที่ดึงมา

ขั้นตอนที่ 6: ทดสอบและปรับใช้

1. ทดสอบระบบ RAG: ใช้แบบสอบถามตัวอย่างเพื่อทดสอบความสามารถของระบบในการดึงเอกสารที่เกี่ยวข้องและสร้างการตอบสนองข้อความที่สอดคล้องกัน
2. ปรับใช้แอปพลิเคชัน: เมื่อทำการทดสอบแล้วให้ปรับใช้แอปพลิเคชัน RAG สำหรับการใช้งานการผลิตเพื่อให้มั่นใจว่าส่วนประกอบทั้งหมดจะได้รับการรักษาความปลอดภัยและกำหนดค่าอย่างเหมาะสม

การตั้งค่านี้ใช้ประโยชน์จากความสามารถในการใช้เหตุผลของ Deepseek และคุณสมบัติฐานข้อมูลเวกเตอร์ของ OpenSearch เพื่อสร้างเวิร์กโฟลว์ RAG ที่แข็งแกร่งใน AWS สำหรับคำแนะนำและสคริปต์โดยละเอียดเพิ่มเติมโปรดดูเอกสาร AWS และที่เก็บ GitHub ที่เกี่ยวข้องกับ Deepseek และ OpenSearch [1] [2] [6]

การอ้างอิง:
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXEIXVUVNW
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c364686666666666

ฉันจะตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) ได้อย่างไรกับ Deepseek บน AWS