Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon ฉันจะตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) ได้อย่างไรกับ Deepseek บน AWS


ฉันจะตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) ได้อย่างไรกับ Deepseek บน AWS


การตั้งค่าเวิร์กโฟลว์ Augmented Generation (RAG) การดึงข้อมูลด้วย Deepseek บน AWS นั้นเกี่ยวข้องกับหลายขั้นตอนโดยใช้ Amazon Sagemaker และ Amazon OpenSearch Service นี่คือคำแนะนำโดยละเอียดเกี่ยวกับวิธีการใช้งานนี้:

ขั้นตอนที่ 1: ปรับใช้ Deepseek-R1 ใน Amazon Sagemaker

1. สร้างโดเมน Sagemaker: นำทางไปยัง Amazon Sagemaker และสร้างโดเมนใหม่ เลือกตัวเลือก "การตั้งค่าอย่างรวดเร็วของผู้ใช้เดี่ยว" และรอให้การตั้งค่าเสร็จสมบูรณ์
2. ปรับใช้โมเดล Deepseek-R1: เมื่อโดเมนของคุณพร้อมให้เปิดสตูดิโอ Sagemaker และปรับใช้โมเดล Deepseek-R1 ขั้นตอนนี้เกี่ยวข้องกับการตั้งค่าจุดสิ้นสุดสำหรับโมเดล

ขั้นตอนที่ 2: ตั้งค่าบริการ OpenSearch Amazon

1. สร้างโดเมน OpenSearch: ไปที่คอนโซล AWS และสร้างโดเมน OpenSearch ใหม่ สิ่งนี้จะทำหน้าที่เป็นฐานข้อมูลเวกเตอร์ของคุณสำหรับการจัดเก็บและดึงการฝังตัว
2. กำหนดค่าบทบาทของ IAM: สร้างบทบาทของ IAM เพื่อจัดการการอนุญาตระหว่าง OpenSearch และ Sagemaker ซึ่งรวมถึงบทบาทสำหรับการเรียกใช้โมเดล Sagemaker และสำหรับผู้ใช้ของคุณในการสร้างตัวเชื่อมต่อ

ขั้นตอนที่ 3: กำหนดค่าบทบาทและการอนุญาตของ IAM

1. สร้างบทบาท IAM สำหรับการเข้าถึง Sagemaker: บทบาทนี้ช่วยให้ OpenSearch เรียกใช้โมเดล Deepseek บน Sagemaker แนบนโยบายที่จำเป็นเพื่อเปิดใช้งานการเรียกใช้แบบจำลอง
2. กำหนดค่าบทบาทของ IAM ใน OpenSearch: ตรวจสอบให้แน่ใจว่า OpenSearch มีสิทธิ์ที่จำเป็นในการโต้ตอบกับโมเดล Sagemaker

ขั้นตอนที่ 4: สร้างตัวเชื่อมต่อ OpenSearch

1. ใช้สคริปต์เพื่อสร้างตัวเชื่อมต่อ: ใช้สคริปต์ Python ที่ให้ไว้เพื่อสร้างตัวเชื่อมต่อ OpenSearch ไปยัง Sagemaker ตัวเชื่อมต่อนี้ช่วยให้ OpenSearch เรียกรุ่น Deepseek สำหรับการสร้างข้อความ
2. ลงทะเบียนรุ่น: ใช้ OpenSearch API เพื่อลงทะเบียนรุ่น Deepseek สิ่งนี้เกี่ยวข้องกับการระบุชื่อโมเดลประเภทฟังก์ชันและ ID ตัวเชื่อมต่อ

ขั้นตอนที่ 5: ใช้เวิร์กโฟลว์ RAG

1. ใช้การฝังเวกเตอร์สำหรับการค้นหา: กำหนดค่า OpenSearch เพื่อใช้การฝังเวกเตอร์สำหรับการค้นหาความหมาย สิ่งนี้ช่วยให้การดึงเอกสารที่เกี่ยวข้องถูกต้องมากขึ้น
2. รวมเข้ากับ Deepseek สำหรับการสร้างข้อความ: เมื่อเรียกคืนเอกสารที่เกี่ยวข้องให้ใช้โมเดล Deepseek เพื่อสร้างการตอบสนองข้อความตามข้อมูลที่ดึงมา

ขั้นตอนที่ 6: ทดสอบและปรับใช้

1. ทดสอบระบบ RAG: ใช้แบบสอบถามตัวอย่างเพื่อทดสอบความสามารถของระบบในการดึงเอกสารที่เกี่ยวข้องและสร้างการตอบสนองข้อความที่สอดคล้องกัน
2. ปรับใช้แอปพลิเคชัน: เมื่อทำการทดสอบแล้วให้ปรับใช้แอปพลิเคชัน RAG สำหรับการใช้งานการผลิตเพื่อให้มั่นใจว่าส่วนประกอบทั้งหมดจะได้รับการรักษาความปลอดภัยและกำหนดค่าอย่างเหมาะสม

การตั้งค่านี้ใช้ประโยชน์จากความสามารถในการใช้เหตุผลของ Deepseek และคุณสมบัติฐานข้อมูลเวกเตอร์ของ OpenSearch เพื่อสร้างเวิร์กโฟลว์ RAG ที่แข็งแกร่งใน AWS สำหรับคำแนะนำและสคริปต์โดยละเอียดเพิ่มเติมโปรดดูเอกสาร AWS และที่เก็บ GitHub ที่เกี่ยวข้องกับ Deepseek และ OpenSearch [1] [2] [6]

การอ้างอิง:
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXEIXVUVNW
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194e24b-49c8-f3c1-2748-3b9c364686666666666