AWS에서 DeepSeek와 함께 검색 증강 생성 (RAG) 워크 플로 설정

AWS에서 DeepSeek와 함께 검색 증강 생성 (RAG) 워크 플로를 설정하려면 어떻게해야합니까?

AWS에서 DeepSeek와 함께 검색 증강 세대 (RAG) 워크 플로우를 설정하려면 주로 Amazon Sagemaker 및 Amazon OpenSearch Service를 사용하는 여러 단계가 포함됩니다. 다음은 이것을 구현하는 방법에 대한 자세한 안내서입니다.

1 단계 : Amazon Sagemaker에 DeepSeek-R1을 배포하십시오

1. Sagemaker 도메인 작성 : Amazon Sagemaker로 이동하여 새 도메인을 만듭니다. "단일 사용자 빠른 설정"옵션을 선택하고 설정이 완료 될 때까지 기다리십시오.
2. DeepSeek-R1 모델 배포 : 도메인이 준비되면 Sagemaker Studio를 열고 DeepSeek-R1 모델을 배포하십시오. 이 단계에는 모델의 엔드 포인트를 설정하는 것이 포함됩니다.

2 단계 : Amazon OpenSearch Service 설정

1. OpenSearch 도메인 작성 : AWS 콘솔로 이동하여 새로운 OpenSearch 도메인을 만듭니다. 이것은 임베딩을 저장 및 검색하기위한 벡터 데이터베이스 역할을합니다.
2. IAM 역할 구성 : OpenSearch와 Sagemaker 간의 권한을 관리하기 위해 IAM 역할을 작성합니다. 여기에는 Sagemaker 모델을 호출하고 사용자가 커넥터를 작성하는 역할이 포함됩니다.

3 단계 : IAM 역할 및 권한 구성

1. Sagemaker Access의 IAM 역할 만들기 :이 역할을 통해 OpenSearch는 Sagemaker에서 DeepSeek 모델을 호출 할 수 있습니다. 모델 호출을 활성화하기 위해 필요한 정책을 첨부하십시오.
2. OpenSearch에서 IAM 역할 구성 : OpenSearch가 SAGEMAKER 모델과 상호 작용하는 데 필요한 권한이 있는지 확인하십시오.

4 단계 : OpenSearch 커넥터 작성

1. 스크립트를 사용하여 커넥터를 작성하십시오. 제공된 Python 스크립트를 사용하여 Sagemaker에게 OpenSearch 커넥터를 만듭니다. 이 커넥터를 사용하면 OpenSearch가 텍스트 생성을 위해 DeepSeek 모델을 호출 할 수 있습니다.
2. 모델 등록 : OpenSearch API를 사용하여 DeepSeek 모델을 등록하십시오. 여기에는 모델 이름, 기능 유형 및 커넥터 ID를 지정하는 것이 포함됩니다.

5 단계 : Rag Workflow 구현

1. 검색에 벡터 임베딩을 사용하십시오 : Semantic 검색에 벡터 임베딩을 사용하도록 OpenSearch를 구성하십시오. 이를 통해 관련 문서를보다 정확하게 검색 할 수 있습니다.
2. 텍스트 생성을 위해 DeepSeek와 통합 : 관련 문서가 검색되면 딥 셀 모델을 사용하여 검색된 정보를 기반으로 텍스트 응답을 생성하십시오.

6 단계 : 테스트 및 배포

1. RAG 시스템 테스트 : 샘플 쿼리를 사용하여 관련 문서를 검색하고 일관된 텍스트 응답을 생성하는 시스템의 기능을 테스트합니다.
2. 응용 프로그램 배포 : 일단 테스트되면 생산 사용을 위해 RAG 응용 프로그램을 배포하여 모든 구성 요소를 올바르게 안전하고 구성하도록합니다.

이 설정은 DeepSeek의 추론 기능을 활용하고 OpenSearch의 벡터 데이터베이스 기능을 활용하여 AWS에서 강력한 Rag Workflow를 만듭니다. 자세한 지침 및 스크립트는 DeepSeek 및 OpenSearch [1] [2] [6]와 관련된 AWS 문서 및 GitHub 리포지토리를 참조하십시오.

인용 :
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXEIXVUVNW
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194E24B-49C8-F3C1-2748-3B9C36468666