DeepSeek-R1 모델을위한 맞춤형 가드 레일을 생성하려면 생성 AI 애플리케이션에서 안전 및 제어를 향상시키기 위해 Amazon Bedrock의 기능을 활용하여 여러 단계가 포함됩니다. 다음은이 가드 레일을 구현하는 방법에 대한 자세한 안내서입니다.
전제 조건
GuardRails를 설정하기 전에 Amazon Bedrock에 액세스 할 수있는 AWS 계정 및 필요한 IAM 권한이 있는지 확인하십시오. 또한 Amazon Bedrock의 사용자 정의 모델 가져 오기 기능을 사용하여 DeepSeek-R1 모델을 이미 가져 왔을 것입니다 [4].
1 단계 : 환경 설정
1. Amazon Bedrock에 액세스하십시오 : Amazon Bedrock 콘솔로 이동하여 DeepSeek-R1 모델에 액세스 할 수 있는지 확인하십시오.
2. 종속성 설치 : Jupyter 노트북 또는 유사한 환경을 사용하여 필요한 종속성을 설치하십시오. 이것은 AWS 서비스와 상호 작용하기 위해`boto3`와 같은 Python 라이브러리를 사용하여 수행 할 수 있습니다 [4].
2 단계 : 가드 레일 구성
1. GuardRail 만들기 :`Boto3`를 통해 AWS 관리 콘솔 또는 프로그래밍 방식 접근법을 사용하여 GuardRail을 만듭니다. 여기에는 컨텐츠 필터, 주제 필터, 워드 필터 및 민감한 정보 필터와 같은 특정 사용 사례에 맞춰진 정책을 정의하는 것이 포함됩니다 [2] [4].
2. 필터 구성 : 예를 들어, 의료 컨텍스트에서 작업하는 경우 "Healthcare Content Filters"라는 GuardRail을 만들 수 있습니다. 증오, 모욕, 성적 콘텐츠 및 폭력과 같은 범주에 대해 입력 및 출력의 필터 강도를 "High"로 설정하십시오 [1].
3. 프롬프트 가드 활성화 : 가드 레일을 구현하여 모델에 도달하기 전에 유해하거나 부적절한 프롬프트를 감지하고 차단하도록 구성하여 프롬프트 공격을 방지합니다 [3] [4].
3 단계 : 가드 레일 테스트
1. 모델 API 호출 :`invokemodel API '를 사용하여 가드 레일을 테스트하십시오. 여기에는 모델과 상호 작용하도록 토큰 화기 및 기반암 런타임 클라이언트를 초기화하는 것이 포함됩니다 [1].
2. 테스트 사례 실행 : 모델에서 원시 응답을 관찰하기 위해 GuardRails가없는 시나리오로 시작하십시오. 그런 다음 Guardrails와 동일한 프롬프트를 다시 실행하여 부적절한 컨텐츠를 개입하고 차단하는 방법을 확인했습니다 [1].
3. 성능 평가 : 제한된 주제 나 민감한 정보와 같은 다양한 입력에 대해 테스트하여 유해한 콘텐츠를 올바르게 식별하고 차단하도록 가드 레일의 효과를 평가하십시오 [4].
4 단계 : 정제 가드 레일
1. 필터 조정 : 테스트 결과를 기반으로, 필터 강도를 조정하거나 사용 사례 요구 사항을 더 잘 일치시키기 위해 필요에 따라 새 필터를 추가하여 GuardRail 정책을 개선하십시오 [7].
2. 차단 된 메시징 : 가드 레일이 개입 할 때 적절한 응답을 제공하기 위해 차단 된 메시징을 구성하여 안전 표준을 유지하면서 원활한 사용자 경험을 보장합니다 [7].
결론
Amazon Bedrock을 사용하여 DeepSeek-R1 용 사용자 정의 가드 레일 구현은 사용자 입력 및 모델 출력에 대한 강력한 컨트롤을 제공하여 AI 애플리케이션의 안전성과 안정성을 향상시킵니다. 이 프로세스는 생성 AI 배포가 특정 안전 기준 및 규제 요구 사항을 준수하여보다 신뢰할 수 있고 안전하게 만듭니다.
인용 :
[1] https://www.youtube.com/watch?v=dv42vlp-rmg
[2] https://repost.aws/questions/qum-c06qe1r6ev6bnsdbetga/bedrock-guardrails-withe-deepseek
[3] https://www.trendmicro.com/en_gb/research/25/c/exploiting-deepseek-r1.html
[4] https://aws.amazon.com/blogs/machine-learning/protect-your-deepseek-deployments-with-amazon-bedrock-guardrails/
[5] https://aws.amazon.com/blogs/machine-learning/deploy-deepseek-r1-distilled-llama-models-with-amazon-bedrock-custom-model-import/
[6] https://www.reddit.com/r/openai/comments/1i5pr7q/it_just_happened_deepseekr1_is_here/
[7] https://aws.amazon.com/blogs/aws/deepseek-r1-now-available-as-a-ly-ly-managed-serverless-model-in-amazon-bedrock/
[8] https://www.youtube.com/watch?v=w3fbsyfevz4
[9] https://www.solo.io/blog/navigating-deepseek-r1-security-concerns-and-guardrails