AWS에서 DeepSeek와 함께 검색 증강 세대 (RAG) 워크 플로우를 설정하려면 주로 Amazon Sagemaker 및 Amazon OpenSearch Service를 사용하는 여러 단계가 포함됩니다. 다음은 이것을 구현하는 방법에 대한 자세한 안내서입니다.
1 단계 : Amazon Sagemaker에 DeepSeek-R1을 배포하십시오
1. Sagemaker 도메인 작성 : Amazon Sagemaker로 이동하여 새 도메인을 만듭니다. "단일 사용자 빠른 설정"옵션을 선택하고 설정이 완료 될 때까지 기다리십시오.
2. DeepSeek-R1 모델 배포 : 도메인이 준비되면 Sagemaker Studio를 열고 DeepSeek-R1 모델을 배포하십시오. 이 단계에는 모델의 엔드 포인트를 설정하는 것이 포함됩니다.
2 단계 : Amazon OpenSearch Service 설정
1. OpenSearch 도메인 작성 : AWS 콘솔로 이동하여 새로운 OpenSearch 도메인을 만듭니다. 이것은 임베딩을 저장 및 검색하기위한 벡터 데이터베이스 역할을합니다.
2. IAM 역할 구성 : OpenSearch와 Sagemaker 간의 권한을 관리하기 위해 IAM 역할을 작성합니다. 여기에는 Sagemaker 모델을 호출하고 사용자가 커넥터를 작성하는 역할이 포함됩니다.
3 단계 : IAM 역할 및 권한 구성
1. Sagemaker Access의 IAM 역할 만들기 :이 역할을 통해 OpenSearch는 Sagemaker에서 DeepSeek 모델을 호출 할 수 있습니다. 모델 호출을 활성화하기 위해 필요한 정책을 첨부하십시오.
2. OpenSearch에서 IAM 역할 구성 : OpenSearch가 SAGEMAKER 모델과 상호 작용하는 데 필요한 권한이 있는지 확인하십시오.
4 단계 : OpenSearch 커넥터 작성
1. 스크립트를 사용하여 커넥터를 작성하십시오. 제공된 Python 스크립트를 사용하여 Sagemaker에게 OpenSearch 커넥터를 만듭니다. 이 커넥터를 사용하면 OpenSearch가 텍스트 생성을 위해 DeepSeek 모델을 호출 할 수 있습니다.
2. 모델 등록 : OpenSearch API를 사용하여 DeepSeek 모델을 등록하십시오. 여기에는 모델 이름, 기능 유형 및 커넥터 ID를 지정하는 것이 포함됩니다.
5 단계 : Rag Workflow 구현
1. 검색에 벡터 임베딩을 사용하십시오 : Semantic 검색에 벡터 임베딩을 사용하도록 OpenSearch를 구성하십시오. 이를 통해 관련 문서를보다 정확하게 검색 할 수 있습니다.
2. 텍스트 생성을 위해 DeepSeek와 통합 : 관련 문서가 검색되면 딥 셀 모델을 사용하여 검색된 정보를 기반으로 텍스트 응답을 생성하십시오.
6 단계 : 테스트 및 배포
1. RAG 시스템 테스트 : 샘플 쿼리를 사용하여 관련 문서를 검색하고 일관된 텍스트 응답을 생성하는 시스템의 기능을 테스트합니다.
2. 응용 프로그램 배포 : 일단 테스트되면 생산 사용을 위해 RAG 응용 프로그램을 배포하여 모든 구성 요소를 올바르게 안전하고 구성하도록합니다.
이 설정은 DeepSeek의 추론 기능을 활용하고 OpenSearch의 벡터 데이터베이스 기능을 활용하여 AWS에서 강력한 Rag Workflow를 만듭니다. 자세한 지침 및 스크립트는 DeepSeek 및 OpenSearch [1] [2] [6]와 관련된 AWS 문서 및 GitHub 리포지토리를 참조하십시오.
인용 :
[1] https://www.youtube.com/watch?v=K2BSE_HWL78
[2] https://aws.amazon.com/blogs/big-data/use-deepseek-with-amazon-opensearch-service-vector-database-and-amazon-sagemaker/
[3] https://github.com/opensearch-project/ml-commons/blob/main/docs/tutorials/aws/rag_with_deepseek_r1_model_on_bedrock.md
[4] https://github.com/spidy20/deepseek-rag-app
[5] https://www.youtube.com/watch?v=_JXEIXVUVNW
[6] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-sagemaker/
[7] https://opensearch.org/docs/latest/vector-search/tutorials/rag/rag-deepseek-r1-bedrock/
[8] https://aws-news.com/article/0194E24B-49C8-F3C1-2748-3B9C36468666